Проект: Речевой движок

Processing, playback of audio and video
  • согласен. Но можно в словарях хранить слова с ударениями для большинства слов (кроме замков с замками), просто текст, без сэмплов звуковых не должен быть тяжел..
    И мы уже давно не пешки,
    Мы пули, мы орлы, и решки!
    Война ютит бинарный код,
    Умри, или иди вперед!
  • Ну, как получится. Скорее всего будет немного монотонная речь, как на лекциях. Впрочем я лично к такой речи привык уже: Николай, Катерина, Алена - все в целом говорят однообразно. Есть конечно словари для якобы правильной транскрипции, но результат местами бывает еще "веселей", чем без них.
  • был такой переводчик для детей-виндузятников - Magic Goody.
    можно было заставить сказать Goody(тупую утку помошника) что угодно
    движок использовал Sam.
  • Globalizer
    Есть такая штука Microsoft Agent называется...
  • И какое отношение это имеет к разработке движка под Колибри?
  • Mario, возвращаясь к ударениям - в озвучке Эсперанто такой проблемы стоять не будет - там все ударения на предпоследний слог, если он есть, иначе - на последний.

    А еще там буквы не меняют звучание соседних букв, за редким исключением.

    Практически идеальный язык для озвучки =)
    И мы уже давно не пешки,
    Мы пули, мы орлы, и решки!
    Война ютит бинарный код,
    Умри, или иди вперед!
  • Отлично - осталось только заставить всех выучить эсперанто...
  • Это не так сложно, как кажется, но я не об этом, а о том, что есть языки, для которых поддержка ударений может быть реализована весьма просто, из чего следует пожелание чтобы файл описания языка для сабжа мог включать/выключать такую поддержку.

    Да, если система -чудом- (зачеркнуто) будет Open-Source, я мог бы реализовать это самостоятельно, но такие вещи лучше иметь ввиду еще на этапе проектирования (а то и планирования).
    И мы уже давно не пешки,
    Мы пули, мы орлы, и решки!
    Война ютит бинарный код,
    Умри, или иди вперед!
  • На всякий случай - я не отказался от проекта. Тем более наличие ажно 2-х маленьких компов (Roverbook U800 и eBox-3300MX), в каждом из которых уже работает звук, делают эту цель ближе.
  • Не прошло и три года.

    SPEECH v0.1
    Если просто запустить файл то будет прочитан некоторый текст, если при запуске указать путь к файлу с текстом в кодировке cp866 - будет читать целевой файл.

    Просьба СПИЧА сильно не ругать - он еще совсем маленький, ему и дня от роду нету. Вот когда подрастет лет через 300, мы женим его на дочке подводного царя, побывает у хороших логопедов, вот тогда и будете ругать.
    Last edited by Mario on Thu May 03, 2012 12:45 am, edited 2 times in total.
  • Даа, отличается умом и сообразительностью! :lol:
    Я думаю, что нужно как-то менять длительность звуков и составить фонетический словарь (или использовать готовый). Мне кажется, что большинство программ произносят именно по звукам.
    А вообще - это офигенно круто! Молодец!
  • SPEECH v0.2
    1) Уменьшил размер семплов, но перевести их на Mono пока не получилось. В Qemu заклинивает всю систему после пары десятков вызовов воспроизведения Mono PCM. Не понятно, то ли баг в реализации драйвера AC97, то ли баг в самом Qemu. На Roverbook все прокатывает нормально, но там драйвер совершенно особенный не имеющий отношения к AC97 и HDA. Будет время поэкспериментирую с HDA кодеками. К сожалению реального железа с AC97 у меня уже в наличии нет.
    2) Темп речи ускорился, но разборчивость субъективно уменьшилась. Во встроенном примере зачитывается специально подготовленный текст с разделителями между слогами.

    Я думаю, что заметного улучшения качества при по буквенном воспроизведение не удастся получить. Соответственно нужно делать вариант 2.
  • Всё-таки можно, я считаю. Если поиграться с длительностью звуков и их высотой, то должно сработать.
  • Проблема не только в этом, а в том что в разных сочетаниях букв получаются разные связующие переходы между ними. В двух выложенных версиях я использовал эффекты нарастания и затухания, чтобы сгладить стыки. Однако когда произносятся цельные слоги или слова стыки между звуками согласованы по другому. Можно посмотреть в звуковом редакторе визуализацию, чтобы убедится в этом. Я пользуюсь Audacity для редактирования.
  • Who is online

    Users browsing this forum: No registered users and 5 guests