Проект: Речевой движок

Tue Nov 02, 2010 9:21 pm

Gluk
Это если текст заранее подготовлен. А если нет, то наличие ударения не там где нужно будет только напрягать.

Tue Nov 02, 2010 9:25 pm

согласен. Но можно в словарях хранить слова с ударениями для большинства слов (кроме замков с замками), просто текст, без сэмплов звуковых не должен быть тяжел..

Tue Nov 02, 2010 9:29 pm

Ну, как получится. Скорее всего будет немного монотонная речь, как на лекциях. Впрочем я лично к такой речи привык уже: Николай, Катерина, Алена - все в целом говорят однообразно. Есть конечно словари для якобы правильной транскрипции, но результат местами бывает еще "веселей", чем без них.

Sat Apr 16, 2011 10:10 am

был такой переводчик для детей-виндузятников - Magic Goody.
можно было заставить сказать Goody(тупую утку помошника) что угодно
движок использовал Sam.

Sat Apr 16, 2011 12:20 pm

Globalizer
Есть такая штука Microsoft Agent называется...

Sat Apr 16, 2011 3:34 pm

И какое отношение это имеет к разработке движка под Колибри?

Wed Apr 20, 2011 12:52 pm

Mario, возвращаясь к ударениям - в озвучке Эсперанто такой проблемы стоять не будет - там все ударения на предпоследний слог, если он есть, иначе - на последний.

А еще там буквы не меняют звучание соседних букв, за редким исключением.

Практически идеальный язык для озвучки =)

Wed Apr 20, 2011 12:53 pm

Отлично - осталось только заставить всех выучить эсперанто...

Wed Apr 20, 2011 1:31 pm

Это не так сложно, как кажется, но я не об этом, а о том, что есть языки, для которых поддержка ударений может быть реализована весьма просто, из чего следует пожелание чтобы файл описания языка для сабжа мог включать/выключать такую поддержку.

Да, если система -чудом- (зачеркнуто) будет Open-Source, я мог бы реализовать это самостоятельно, но такие вещи лучше иметь ввиду еще на этапе проектирования (а то и планирования).

Mon Jun 13, 2011 12:04 am

На всякий случай - я не отказался от проекта. Тем более наличие ажно 2-х маленьких компов (Roverbook U800 и eBox-3300MX), в каждом из которых уже работает звук, делают эту цель ближе.

Wed Apr 25, 2012 1:26 am

Не прошло и три года.

SPEECH v0.1
Если просто запустить файл то будет прочитан некоторый текст, если при запуске указать путь к файлу с текстом в кодировке cp866 - будет читать целевой файл.

Просьба СПИЧА сильно не ругать - он еще совсем маленький, ему и дня от роду нету. Вот когда подрастет ~~лет через 300, мы женим его на дочке подводного царя~~, побывает у хороших логопедов, вот тогда и будете ругать.

Wed Apr 25, 2012 8:52 am

Даа, отличается умом и сообразительностью!

Я думаю, что нужно как-то менять длительность звуков и составить фонетический словарь (или использовать готовый). Мне кажется, что большинство программ произносят именно по звукам.
А вообще - это офигенно круто! Молодец!

Thu May 03, 2012 12:53 am

SPEECH v0.2
1) Уменьшил размер семплов, но перевести их на Mono пока не получилось. В Qemu заклинивает всю систему после пары десятков вызовов воспроизведения Mono PCM. Не понятно, то ли баг в реализации драйвера AC97, то ли баг в самом Qemu. На Roverbook все прокатывает нормально, но там драйвер совершенно особенный не имеющий отношения к AC97 и HDA. Будет время поэкспериментирую с HDA кодеками. К сожалению реального железа с AC97 у меня уже в наличии нет.
2) Темп речи ускорился, но разборчивость субъективно уменьшилась. Во встроенном примере зачитывается специально подготовленный текст с разделителями между слогами.

Я думаю, что заметного улучшения качества при по буквенном воспроизведение не удастся получить. Соответственно нужно делать вариант 2.

Thu May 03, 2012 9:11 am

Всё-таки можно, я считаю. Если поиграться с длительностью звуков и их высотой, то должно сработать.

Thu May 03, 2012 10:52 am

Проблема не только в этом, а в том что в разных сочетаниях букв получаются разные связующие переходы между ними. В двух выложенных версиях я использовал эффекты нарастания и затухания, чтобы сгладить стыки. Однако когда произносятся цельные слоги или слова стыки между звуками согласованы по другому. Можно посмотреть в звуковом редакторе визуализацию, чтобы убедится в этом. Я пользуюсь Audacity для редактирования.

Проект: Речевой движок

Who is online