Gluk
Это если текст заранее подготовлен. А если нет, то наличие ударения не там где нужно будет только напрягать.
Проект: Речевой движок
согласен. Но можно в словарях хранить слова с ударениями для большинства слов (кроме замков с замками), просто текст, без сэмплов звуковых не должен быть тяжел..
И мы уже давно не пешки,
Мы пули, мы орлы, и решки!
Война ютит бинарный код,
Умри, или иди вперед!
Мы пули, мы орлы, и решки!
Война ютит бинарный код,
Умри, или иди вперед!
Ну, как получится. Скорее всего будет немного монотонная речь, как на лекциях. Впрочем я лично к такой речи привык уже: Николай, Катерина, Алена - все в целом говорят однообразно. Есть конечно словари для якобы правильной транскрипции, но результат местами бывает еще "веселей", чем без них.
был такой переводчик для детей-виндузятников - Magic Goody.
можно было заставить сказать Goody(тупую утку помошника) что угодно
движок использовал Sam.
можно было заставить сказать Goody(тупую утку помошника) что угодно
движок использовал Sam.
Globalizer
Есть такая штука Microsoft Agent называется...
Есть такая штука Microsoft Agent называется...
И какое отношение это имеет к разработке движка под Колибри?
Mario, возвращаясь к ударениям - в озвучке Эсперанто такой проблемы стоять не будет - там все ударения на предпоследний слог, если он есть, иначе - на последний.
А еще там буквы не меняют звучание соседних букв, за редким исключением.
Практически идеальный язык для озвучки =)
А еще там буквы не меняют звучание соседних букв, за редким исключением.
Практически идеальный язык для озвучки =)
И мы уже давно не пешки,
Мы пули, мы орлы, и решки!
Война ютит бинарный код,
Умри, или иди вперед!
Мы пули, мы орлы, и решки!
Война ютит бинарный код,
Умри, или иди вперед!
Отлично - осталось только заставить всех выучить эсперанто...
Это не так сложно, как кажется, но я не об этом, а о том, что есть языки, для которых поддержка ударений может быть реализована весьма просто, из чего следует пожелание чтобы файл описания языка для сабжа мог включать/выключать такую поддержку.
Да, если система -чудом- (зачеркнуто) будет Open-Source, я мог бы реализовать это самостоятельно, но такие вещи лучше иметь ввиду еще на этапе проектирования (а то и планирования).
Да, если система -чудом- (зачеркнуто) будет Open-Source, я мог бы реализовать это самостоятельно, но такие вещи лучше иметь ввиду еще на этапе проектирования (а то и планирования).
И мы уже давно не пешки,
Мы пули, мы орлы, и решки!
Война ютит бинарный код,
Умри, или иди вперед!
Мы пули, мы орлы, и решки!
Война ютит бинарный код,
Умри, или иди вперед!
На всякий случай - я не отказался от проекта. Тем более наличие ажно 2-х маленьких компов (Roverbook U800 и eBox-3300MX), в каждом из которых уже работает звук, делают эту цель ближе.
Не прошло и три года.
SPEECH v0.1
Если просто запустить файл то будет прочитан некоторый текст, если при запуске указать путь к файлу с текстом в кодировке cp866 - будет читать целевой файл.
Просьба СПИЧА сильно не ругать - он еще совсем маленький, ему и дня от роду нету. Вот когда подрастетлет через 300, мы женим его на дочке подводного царя, побывает у хороших логопедов, вот тогда и будете ругать.
SPEECH v0.1
Если просто запустить файл то будет прочитан некоторый текст, если при запуске указать путь к файлу с текстом в кодировке cp866 - будет читать целевой файл.
Просьба СПИЧА сильно не ругать - он еще совсем маленький, ему и дня от роду нету. Вот когда подрастет
Last edited by Mario on Thu May 03, 2012 12:45 am, edited 2 times in total.
Даа, отличается умом и сообразительностью!
Я думаю, что нужно как-то менять длительность звуков и составить фонетический словарь (или использовать готовый). Мне кажется, что большинство программ произносят именно по звукам.
А вообще - это офигенно круто! Молодец!
Я думаю, что нужно как-то менять длительность звуков и составить фонетический словарь (или использовать готовый). Мне кажется, что большинство программ произносят именно по звукам.
А вообще - это офигенно круто! Молодец!
SPEECH v0.2
1) Уменьшил размер семплов, но перевести их на Mono пока не получилось. В Qemu заклинивает всю систему после пары десятков вызовов воспроизведения Mono PCM. Не понятно, то ли баг в реализации драйвера AC97, то ли баг в самом Qemu. На Roverbook все прокатывает нормально, но там драйвер совершенно особенный не имеющий отношения к AC97 и HDA. Будет время поэкспериментирую с HDA кодеками. К сожалению реального железа с AC97 у меня уже в наличии нет.
2) Темп речи ускорился, но разборчивость субъективно уменьшилась. Во встроенном примере зачитывается специально подготовленный текст с разделителями между слогами.
Я думаю, что заметного улучшения качества при по буквенном воспроизведение не удастся получить. Соответственно нужно делать вариант 2.
1) Уменьшил размер семплов, но перевести их на Mono пока не получилось. В Qemu заклинивает всю систему после пары десятков вызовов воспроизведения Mono PCM. Не понятно, то ли баг в реализации драйвера AC97, то ли баг в самом Qemu. На Roverbook все прокатывает нормально, но там драйвер совершенно особенный не имеющий отношения к AC97 и HDA. Будет время поэкспериментирую с HDA кодеками. К сожалению реального железа с AC97 у меня уже в наличии нет.
2) Темп речи ускорился, но разборчивость субъективно уменьшилась. Во встроенном примере зачитывается специально подготовленный текст с разделителями между слогами.
Я думаю, что заметного улучшения качества при по буквенном воспроизведение не удастся получить. Соответственно нужно делать вариант 2.
Всё-таки можно, я считаю. Если поиграться с длительностью звуков и их высотой, то должно сработать.
Проблема не только в этом, а в том что в разных сочетаниях букв получаются разные связующие переходы между ними. В двух выложенных версиях я использовал эффекты нарастания и затухания, чтобы сгладить стыки. Однако когда произносятся цельные слоги или слова стыки между звуками согласованы по другому. Можно посмотреть в звуковом редакторе визуализацию, чтобы убедится в этом. Я пользуюсь Audacity для редактирования.
Who is online
Users browsing this forum: No registered users and 3 guests