Board.KolibriOS.org

Официальный форум KolibriOS
Текущее время: Пт сен 22, 2017 12:23 am

Часовой пояс: UTC+03:00




Начать новую тему  Ответить на тему  [ 65 сообщений ]  На страницу Пред. 1 2 3 4 5 След.
Автор Сообщение
 Заголовок сообщения: Re: Проект: Речевой движок
СообщениеДобавлено: Вс май 20, 2012 8:12 pm 
Не в сети

Зарегистрирован: Пн сен 24, 2007 11:11 am
Сообщения: 2814
Прогресс крутой. А ты всё же не пробовал именно синтезировать звуки? Так может получиться даже лучше.


Вернуться к началу
 Заголовок сообщения: Re: Проект: Речевой движок
СообщениеДобавлено: Вс май 20, 2012 8:27 pm 
И как по твоему я должен синтезировать звуки? В системе ведь нет звукового генератора. В любом случае придется с семплами работать.


Вернуться к началу
   
 Заголовок сообщения: Re: Проект: Речевой движок
СообщениеДобавлено: Вс май 20, 2012 10:31 pm 
Не в сети

Зарегистрирован: Пн сен 24, 2007 11:11 am
Сообщения: 2814
А ты не задумывался о том, что wave - это просто набор байт?:) Набор байт можно синтезировать. Учитывая, что wave - это не случайный набор байт, а запись определенных характеристик звуков, синтезировать его ещё более реально. Учитывая, что в интернете и книгах имеются сведения, какой именно частоты звуки нужно издать одновременно, чтобы получить нечто похожее на "А", "Бэ", "Вэ" и так далее, шансы неплохие.


Вернуться к началу
 Заголовок сообщения: Re: Проект: Речевой движок
СообщениеДобавлено: Вс май 20, 2012 10:50 pm 
У меня есть несколько пунктов возражений:
1) Математика не мой конек.
2) Ассемблер не располагает к простой реализации сложных математических функций.
3) Я не уверен что код вычисляющий достаточно похожий звук на буквы, будет сильно меньше по размеру, чем готовые семплы. Если не веришь -запиши свой голос и посмотри в каком нибудь редакторе (к примеру Audacity) и увидишь, что даже гласные это не просто синусоида определенной частоты. Зачастую это модулированная по амплитуде несущая.


Последний раз редактировалось Mario Вс май 20, 2012 10:53 pm, всего редактировалось 1 раз.

Вернуться к началу
   
 Заголовок сообщения: Re: Проект: Речевой движок
СообщениеДобавлено: Вс май 20, 2012 10:53 pm 
Не в сети

Зарегистрирован: Пн сен 24, 2007 11:11 am
Сообщения: 2814
espeak занимает 200 килобайт и поддерживает синтез речи на 20 языках. Использует генерацию звуков и качество, вполне меня устраивающее.
Кстати, надеюсь, поможет: http://dmilvdv.narod.ru/SpeechSynthesis/index.html

Вдогонку: http://forum.sources.ru/index.php?s=6e1 ... 4159&st=30


Вернуться к началу
 Заголовок сообщения: Re: Проект: Речевой движок
СообщениеДобавлено: Вс май 20, 2012 10:55 pm 
Формантный синтез в подавляющем большинстве случаев уступает синтезу с помощью качественных семплов. Мне не нужен голос механического существа. В общем это не мой метод.

Вообще чего то не могу найти WAV или MP3 чтобы оценить качество eSpeak, моя попытка запустить его в Шиндошс успехом не увенчалась.


Вернуться к началу
   
 Заголовок сообщения: Re: Проект: Речевой движок
СообщениеДобавлено: Вс май 20, 2012 11:10 pm 
Не в сети

Зарегистрирован: Пн сен 24, 2007 11:11 am
Сообщения: 2814
Вот пример. Словари не используются, русский не поддерживается по причине моей криворукости. Со словарем, в особенности, от mbrola, качество может быть лучше.
http://rghost.ru/38192387


Вернуться к началу
 Заголовок сообщения: Re: Проект: Речевой движок
СообщениеДобавлено: Вс май 20, 2012 11:10 pm 
Нашел примеры в статье http://habrahabr.ru/post/60977/
espeak.wav
festival.wav
Ну, че я могу сказать - eSpeak не фонтан, еще как не фонтан. А вот Festival - вполне торт!


Вернуться к началу
   
 Заголовок сообщения: Re: Проект: Речевой движок
СообщениеДобавлено: Вс май 20, 2012 11:14 pm 
Все равно не фонтан. С помощью семплов можно добиться лучших результатов.
К тому же синтез английской речи более простой чем русской.

Кстати запись для третьей версии движка я делал на упрощенных семплах - 22050 ГЦ, моно, 16 бит. Файл с семплами на 4,66 Мб.


Вернуться к началу
   
 Заголовок сообщения: Re: Проект: Речевой движок
СообщениеДобавлено: Вс май 20, 2012 11:19 pm 
Не в сети

Зарегистрирован: Пн сен 24, 2007 11:11 am
Сообщения: 2814
Ну, festival еще за три года неплохо так прокачали. И к тому же OpenSource. Правда, много Лиспа.

Согласен, с сэмплами можно круче.


Вернуться к началу
 Заголовок сообщения: Re: Проект: Речевой движок
СообщениеДобавлено: Вт май 22, 2012 3:15 am 
SPEECH v0.4
1) Используются слоги до 2-х букв, все что не совпадает формируется из букв.
2) Слово предварительно формируется в буфер PCM из букв и найденных слогов.
3) Семплы теперь сгруппированы в отдельном подгружаемом файле, который собственно и составляет голос. В будущем, если будут другие голоса, можно будет заменять.
Семплы 22КГц, моно, 16 бит.

По прежнему можно запускать с параметром путь к файлу, если запустить без параметра будет зачитывать тестовый файл из самого бинарника.

Сам бинарник:
Вложение:
speech_v04.kex [2.16 КБ]
76 скачиваний

И голосовой файл:
marat_smp.7z 2.8Мб
Распаковать и положить рядом с бинарником.


Вернуться к началу
   
 Заголовок сообщения: Re: Проект: Речевой движок
СообщениеДобавлено: Чт июн 07, 2012 11:18 pm 
Не в сети
Аватара пользователя

Зарегистрирован: Пт июн 27, 2008 3:22 pm
Сообщения: 974
Все-таки сделал её. Да ещё и со своим голосом. :wink: Это очень хорошо, особенно полезна программа будет для людей со слабым зрением.


Вернуться к началу
 Заголовок сообщения: Re: Проект: Речевой движок
СообщениеДобавлено: Пн июл 09, 2012 10:23 am 
Не в сети
Аватара пользователя

Зарегистрирован: Вт авг 25, 2009 4:45 pm
Сообщения: 788
Для справки - espeak портированный на JavaScript http://speak-demo.herokuapp.com/


Вернуться к началу
 Заголовок сообщения: Re: Проект: Речевой движок
СообщениеДобавлено: Пн июл 09, 2012 9:24 pm 
Не в сети

Зарегистрирован: Пн сен 24, 2007 11:11 am
Сообщения: 2814
espeak можно и так портировать, толку-то? Я какой-то английский старый движок тоже портировал, смысла - ноль. У Марата лучше может выйти, я уверен.


Вернуться к началу
 Заголовок сообщения: Re: Проект: Речевой движок
СообщениеДобавлено: Пт ноя 16, 2012 6:59 pm 
Поскольку интерес к программе весьма посредственный, а записывать звук мне довольно затруднительно (мой голос не дикторский, а другим людям нужно платить за работу, плюс у меня нет ни оборудования, ни помещения для записи достаточного качества), то дальнейшая разработка программы откладывается на неопределенный срок.

Возможность передачи исходников в хорошие руки может обсуждаться, но мои семплы голоса при любом раскладе принадлежат мне. Их заливка на SVN не будет красивым поступком - это не код, а данные. По этой причине заливка исходников бессмысленна.


Вернуться к началу
   
Показать сообщения за:  Поле сортировки  
Начать новую тему  Ответить на тему  [ 65 сообщений ]  На страницу Пред. 1 2 3 4 5 След.

Часовой пояс: UTC+03:00


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  
Создано на основе phpBB® Forum Software © phpBB Limited
Русская поддержка phpBB