Речевой синтезатор капитан. "Синтезатор речи Google": как пользоваться программой

Внимание! Данный сайт использует технологию JavaScript, поддержка которой отключена в вашем браузере. Для полноценной работы с ресурсом рекомендуется включить эту функцию в настройках вашего Интернет-обозревателя. Однако всё информационное наполнение сайта доступно и в режиме работы с отключённым JavaScript, поэтому активация этой настройки не обязательна, хотя и рекомендована.


Речевой синтезатор Капитан

"Речевой синтезатор Капитан" - это MS SAPI4-совместимый синтезатор. Он поддерживает синтез речи на русском и украинском языке. Поддержка украинского языка основывается на подмене украинских фонем похожими по звучанию фонемами русского языка.

Синтезатор создан на аллофонной базе одного из десяти голосов программного TTS-комплекса "Speaking Mouse Home", который был разработан Клубом голосовых технологий при научном парке МГУ в 1995 году. По наследству данному синтезатору досталось имя его прототипа из "Speaking Mouse Home" - Капитан.

Помимо русского и украинского языков Капитан способен осуществлять работу с английским, немецким и французским языком, а также производить раздельное чтение многоязычных текстов: каждый язык соответствующим голосом синтезатора. Раздельное чтение многоязычных документов и поддержка английского, немецкого и французского языков осуществляется посредствам использования дополнительного модуля, основанного на базе синтезатора eSpeak , однако использования данного модуля для работы Капитана не обязательно. Поддержка русского и украинского языков может осуществляться и без его установки. Данный модуль расширения возможностей Капитана уже включён в архив, который вы можете скачать с нашего сайта, поэтому его отдельная загрузка, как описано в сопроводительной документации самого синтезатора, не требуется.

Синтезатор обладает мужским голосом с хорошей разборчивостью речи, но низкой естественностью звучания. К плюсом можно отнести большую скорость работы, малый размер и малую загрузку системных мощностей. Однако "Капитан" обладает и рядом недостатков:

  • Синтезатором практически не поддерживается функция регулировки высоты речи.
  • В процессе работы иногда могут возникать явления "проглатывания" звуков.
  • Периодически синтезатор может замолкать в процессе работы или начать читать лишь первую часть строк текста. В данном случаи для возвращения штатного режима работы рекомендуется перегрузить синтезатор.

Для работы данного синтезатора может понадобиться системный компонент

К:Википедия:Статьи без изображений (тип: не указан) К:Программное обеспечение, разработанное в 2006 году

eSpeak это компактный свободный программный синтезатор речи , поддерживающий Speech Synthesis Markup Language (SSML).

Операционные системы

Версии eSpeak существуют под такие операционные системы как Microsoft Windows , Mac OS X , Linux , RISC OS , а также доступен его исходный код на языке C++ . Кроме того в официальной документации синтезатора даётся инструкция по его компиляции под Windows Mobile . Программа имеет одно существенное ограничение - генерация голоса возможна только в WAV файл.

Помимо этого, eSpeak используется в мобильных операционных системах Android , начиная с версии 1.6, и Maemo , но эти проекты не курируются лично разработчиком, и на официальном сайте eSpeak соответствующие пакеты отсутствуют, да и Android -версия обладает рядом существенных ошибок при работе на некоторых языках, в частности и русском.

Поддерживаемые языки

eSpeak поддерживает около пяти десятков различных языков. При инсталляции, пользователю требуется указать, поддержка каких именно диалектов его интересует.

Ниже представлен список языков, поддерживаемых синтезатором eSpeak, и их обозначений, которые используются в его настройках.

  • Албанский - sq
  • Английский (американский) - en-us
  • Английский (британский с северным акцентом) - en-n
  • Английский (британский с Уэст-Мидлендским акцентом) - en-wm
  • Английский (классический британский) - en
  • Английский (общепринятый разговорный) - en-rp
  • Английский (шотландский) - en-sc
  • Армянский (западный) - hy-west
  • Армянский (классический) - hy
  • Африкаанс - af
  • Боснийский - bs
  • Валлийский - cy
  • Венгерский - hu
  • Вьетнамский - vi
  • Голландский - nl
  • Голоса MBROLA (голос xxx) - mb-xxx
  • Греческий - el
  • Древнегреческий - grc
  • Индонезийский - id
  • Исландский - is
  • Испанский (классический) - es
  • Испанский (латиноамериканский) - es-la
  • Итальянский - it
  • Каталанский - ca
  • Китайский (кантонский диалект) - zh-yue
  • Китайский (путунхуа) - zh
  • Курдский - ku
  • Латинский - la
  • Латышский - lv
  • Ложбан - jbo
  • Македонский - mk
  • Немецкий - de
  • Норвежский - no
  • Польский - pl
  • Португальский (бразильский) - pt
  • Португальский (европейский) - pt-pt
  • Румынский - ro
  • Русский - ru
  • Сербский - sr
  • Словацкий - sk
  • Словенский - sw
  • Тамильский - ta
  • Турецкий - tr
  • Финский - fi
  • Французский - fr
  • Хинди - hi
  • Хорватский - hr
  • Чешский (разговорный) - cs
  • Шведский - sv
  • Эсперанто - eo

Список поддерживаемых языков также может быть расширен при помощи использования голосовых библиотек MBROLA, которые можно подключить к eSpeak.

eSpeak и MBROLA

MBROLA - это особый дифонный алгоритм синтеза речи, на основе которого создано множество различных программных продуктов с включением технологии преобразования текста в речь (TTS). Данный проект является рекордсменом среди прочих технологий синтеза речи по количеству различных языков, для которых он использовался. Хотя для некоторых распространённых языков MBROLA-голоса не созданы до сих пор, в том числе и для русского.

eSpeak может работать в связке с MBROLA, что обеспечивает возможность использовать голосовые библиотеки этого проекта как составную часть самого eSpeak. Это позволяет ещё больше расширить список поддерживаемых языков для синтезирования речи по тексту.

Использовать связку eSpeak и MBROLA можно на таких операционных системах как Windows , Linux и Mac OS X .

Однако интеграцию с eSpeak поддерживают не все голосовые библиотеки MBROLA.

Принципы реализации

Слова входного текста для синтезирования проходят два этапа обработки:

  • слово в буквенном представлении преобразуется в последовательность фонем;
  • генерируется звуковой сигнал на основе полученной последовательности.

Правила для получения последовательности фонем хранятся в виде «A, B, C = D». Где B - это рассматриваемая буква, A и C - контекст окружения этой буквы в слове, и D - это фонема, в которую эта буква может быть преобразована. Контекст окружения может задаваться как конкретными буквами, так и специальными символами, обозначающими группы букв. Правила синтезатора допускают неоднозначное определение таких цепочек. Для разрешения этой неоднозначности синтезатор назначает приоритет каждому правилу, который вычисляется на основе количества букв, задействованных в правиле, и степени конкретности определения контекста окружения. В правилах также можно указывать различия в трансляции в зависимости от ударения.

В eSpeak гласные звуки всегда синтезируются, звонкие согласные получаются путём смешивания синтезируемых звуков с предварительно записанными шумами голоса, а все остальные звуки просто записаны, например, [ш].

Каждый звук, кроме глухих согласных, представлен последовательностью формант. Помимо информации о формантах, каждая фонема имеет информацию о своей амплитуде, длительности звучания и задержке перед последующей фонемой. На основе этих параметров синтезируется звук гласной буквы при помощи алгоритмов, реализованных в синтезаторе. Информация о фонемах и формантах храниться в отдельных файлах, также впоследствии компилируемых в бинарный формат.

Вместе с синтезатором поставляется утилита eSpeak Edit. Это GUI-приложение, написанное при помощи библиотеки WXLib. Оно позволяет визуально редактировать готовые фонемы. Фонема представляется в виде графика кривой, где последовательно можно выбирать форманты и изменять их значения, такие как частота, высота и ширина. Благодаря этим возможностям, на основе уже готовых фонем можно получать новые, более верные звуки для некоторого языка. В то же время, некоторые из фонем получить модификацией существующих не получается. Например, при разработке русскоязычной части eSpeak был специально записан звук [р], так как для него не нашлось достойного аналога в других языках.

Проекты с использованием eSpeak

Сторонние дополнения

Некоторые языки не обладают простыми и универсальными правилами построения грамотной речи и eSpeak требуются дополнительные компоненты, чтобы производить качественный синтез на этих языках. Для того, чтобы избежать увеличения размера основного пакета eSpeak, эти компоненты распространяются отдельно. В частности, в русском языке нет общих правил, устанавливающих ударный слог в словах. В этих случаях eSpeak пытается определить ударение слова, но данное произношение часто не соответствует правильному. Для решения данной задачи существует специальный расширенный словарь произношения, который надо установить отдельно от основного пакета eSpeak.

Помимо русского, сторонние компоненты коррекции речи eSpeak ещё есть для китайского (путунхуа и кантонский).

Скачать эти словари можно с официального сайта проекта.

См. также

Напишите отзыв о статье "ESpeak"

Примечания

Ссылки

  • на .

Отрывок, характеризующий ESpeak

Солдаты товарищи, шедшие рядом с Пьером, не оглядывались, так же как и он, на то место, с которого послышался выстрел и потом вой собаки; но строгое выражение лежало на всех лицах.

Депо, и пленные, и обоз маршала остановились в деревне Шамшеве. Все сбилось в кучу у костров. Пьер подошел к костру, поел жареного лошадиного мяса, лег спиной к огню и тотчас же заснул. Он спал опять тем же сном, каким он спал в Можайске после Бородина.
Опять события действительности соединялись с сновидениями, и опять кто то, сам ли он или кто другой, говорил ему мысли, и даже те же мысли, которые ему говорились в Можайске.
«Жизнь есть всё. Жизнь есть бог. Все перемещается и движется, и это движение есть бог. И пока есть жизнь, есть наслаждение самосознания божества. Любить жизнь, любить бога. Труднее и блаженнее всего любить эту жизнь в своих страданиях, в безвинности страданий».
«Каратаев» – вспомнилось Пьеру.
И вдруг Пьеру представился, как живой, давно забытый, кроткий старичок учитель, который в Швейцарии преподавал Пьеру географию. «Постой», – сказал старичок. И он показал Пьеру глобус. Глобус этот был живой, колеблющийся шар, не имеющий размеров. Вся поверхность шара состояла из капель, плотно сжатых между собой. И капли эти все двигались, перемещались и то сливались из нескольких в одну, то из одной разделялись на многие. Каждая капля стремилась разлиться, захватить наибольшее пространство, но другие, стремясь к тому же, сжимали ее, иногда уничтожали, иногда сливались с нею.
– Вот жизнь, – сказал старичок учитель.
«Как это просто и ясно, – подумал Пьер. – Как я мог не знать этого прежде».
– В середине бог, и каждая капля стремится расшириться, чтобы в наибольших размерах отражать его. И растет, сливается, и сжимается, и уничтожается на поверхности, уходит в глубину и опять всплывает. Вот он, Каратаев, вот разлился и исчез. – Vous avez compris, mon enfant, [Понимаешь ты.] – сказал учитель.
– Vous avez compris, sacre nom, [Понимаешь ты, черт тебя дери.] – закричал голос, и Пьер проснулся.
Он приподнялся и сел. У костра, присев на корточках, сидел француз, только что оттолкнувший русского солдата, и жарил надетое на шомпол мясо. Жилистые, засученные, обросшие волосами, красные руки с короткими пальцами ловко поворачивали шомпол. Коричневое мрачное лицо с насупленными бровями ясно виднелось в свете угольев.
– Ca lui est bien egal, – проворчал он, быстро обращаясь к солдату, стоявшему за ним. – …brigand. Va! [Ему все равно… разбойник, право!]
И солдат, вертя шомпол, мрачно взглянул на Пьера. Пьер отвернулся, вглядываясь в тени. Один русский солдат пленный, тот, которого оттолкнул француз, сидел у костра и трепал по чем то рукой. Вглядевшись ближе, Пьер узнал лиловую собачонку, которая, виляя хвостом, сидела подле солдата.
– А, пришла? – сказал Пьер. – А, Пла… – начал он и не договорил. В его воображении вдруг, одновременно, связываясь между собой, возникло воспоминание о взгляде, которым смотрел на него Платон, сидя под деревом, о выстреле, слышанном на том месте, о вое собаки, о преступных лицах двух французов, пробежавших мимо его, о снятом дымящемся ружье, об отсутствии Каратаева на этом привале, и он готов уже был понять, что Каратаев убит, но в то же самое мгновенье в его душе, взявшись бог знает откуда, возникло воспоминание о вечере, проведенном им с красавицей полькой, летом, на балконе своего киевского дома. И все таки не связав воспоминаний нынешнего дня и не сделав о них вывода, Пьер закрыл глаза, и картина летней природы смешалась с воспоминанием о купанье, о жидком колеблющемся шаре, и он опустился куда то в воду, так что вода сошлась над его головой.
Перед восходом солнца его разбудили громкие частые выстрелы и крики. Мимо Пьера пробежали французы.
– Les cosaques! [Казаки!] – прокричал один из них, и через минуту толпа русских лиц окружила Пьера.
Долго не мог понять Пьер того, что с ним было. Со всех сторон он слышал вопли радости товарищей.
– Братцы! Родимые мои, голубчики! – плача, кричали старые солдаты, обнимая казаков и гусар. Гусары и казаки окружали пленных и торопливо предлагали кто платья, кто сапоги, кто хлеба. Пьер рыдал, сидя посреди их, и не мог выговорить ни слова; он обнял первого подошедшего к нему солдата и, плача, целовал его.
Долохов стоял у ворот разваленного дома, пропуская мимо себя толпу обезоруженных французов. Французы, взволнованные всем происшедшим, громко говорили между собой; но когда они проходили мимо Долохова, который слегка хлестал себя по сапогам нагайкой и глядел на них своим холодным, стеклянным, ничего доброго не обещающим взглядом, говор их замолкал. С другой стороны стоял казак Долохова и считал пленных, отмечая сотни чертой мела на воротах.
– Сколько? – спросил Долохов у казака, считавшего пленных.
– На вторую сотню, – отвечал казак.
– Filez, filez, [Проходи, проходи.] – приговаривал Долохов, выучившись этому выражению у французов, и, встречаясь глазами с проходившими пленными, взгляд его вспыхивал жестоким блеском.
Денисов, с мрачным лицом, сняв папаху, шел позади казаков, несших к вырытой в саду яме тело Пети Ростова.

С 28 го октября, когда начались морозы, бегство французов получило только более трагический характер замерзающих и изжаривающихся насмерть у костров людей и продолжающих в шубах и колясках ехать с награбленным добром императора, королей и герцогов; но в сущности своей процесс бегства и разложения французской армии со времени выступления из Москвы нисколько не изменился.
От Москвы до Вязьмы из семидесятитрехтысячной французской армии, не считая гвардии (которая во всю войну ничего не делала, кроме грабежа), из семидесяти трех тысяч осталось тридцать шесть тысяч (из этого числа не более пяти тысяч выбыло в сражениях). Вот первый член прогрессии, которым математически верно определяются последующие.
Французская армия в той же пропорции таяла и уничтожалась от Москвы до Вязьмы, от Вязьмы до Смоленска, от Смоленска до Березины, от Березины до Вильны, независимо от большей или меньшей степени холода, преследования, заграждения пути и всех других условий, взятых отдельно. После Вязьмы войска французские вместо трех колонн сбились в одну кучу и так шли до конца. Бертье писал своему государю (известно, как отдаленно от истины позволяют себе начальники описывать положение армии). Он писал:
«Je crois devoir faire connaitre a Votre Majeste l"etat de ses troupes dans les differents corps d"annee que j"ai ete a meme d"observer depuis deux ou trois jours dans differents passages. Elles sont presque debandees. Le nombre des soldats qui suivent les drapeaux est en proportion du quart au plus dans presque tous les regiments, les autres marchent isolement dans differentes directions et pour leur compte, dans l"esperance de trouver des subsistances et pour se debarrasser de la discipline. En general ils regardent Smolensk comme le point ou ils doivent se refaire. Ces derniers jours on a remarque que beaucoup de soldats jettent leurs cartouches et leurs armes. Dans cet etat de choses, l"interet du service de Votre Majeste exige, quelles que soient ses vues ulterieures qu"on rallie l"armee a Smolensk en commencant a la debarrasser des non combattans, tels que hommes demontes et des bagages inutiles et du materiel de l"artillerie qui n"est plus en proportion avec les forces actuelles. En outre les jours de repos, des subsistances sont necessaires aux soldats qui sont extenues par la faim et la fatigue; beaucoup sont morts ces derniers jours sur la route et dans les bivacs. Cet etat de choses va toujours en augmentant et donne lieu de craindre que si l"on n"y prete un prompt remede, on ne soit plus maitre des troupes dans un combat. Le 9 November, a 30 verstes de Smolensk».
[Долгом поставляю донести вашему величеству о состоянии корпусов, осмотренных мною на марше в последние три дня. Они почти в совершенном разброде. Только четвертая часть солдат остается при знаменах, прочие идут сами по себе разными направлениями, стараясь сыскать пропитание и избавиться от службы. Все думают только о Смоленске, где надеются отдохнуть. В последние дни много солдат побросали патроны и ружья. Какие бы ни были ваши дальнейшие намерения, но польза службы вашего величества требует собрать корпуса в Смоленске и отделить от них спешенных кавалеристов, безоружных, лишние обозы и часть артиллерии, ибо она теперь не в соразмерности с числом войск. Необходимо продовольствие и несколько дней покоя; солдаты изнурены голодом и усталостью; в последние дни многие умерли на дороге и на биваках. Такое бедственное положение беспрестанно усиливается и заставляет опасаться, что, если не будут приняты быстрые меры для предотвращения зла, мы скоро не будем иметь войска в своей власти в случае сражения. 9 ноября, в 30 верстах от Смоленка.]
Ввалившись в Смоленск, представлявшийся им обетованной землей, французы убивали друг друга за провиант, ограбили свои же магазины и, когда все было разграблено, побежали дальше.

VoiceFabric - это интернет-сервис, позволяющий озвучивать синтезированным голосом любую текстовую информацию.
На сайте voicefabric.ru доступен демо-синтез с различными голосами, с его помощью Вы можете оценить качество синтеза. На сегодняшний день доступно 8 голосов (женских и мужских), которые умеют говорить на 3-х языках (русский, английский, казахский).

Синтез речи от ЦРТ полезен при необходимости персонификации исходящих голосовых сообщений. Решение позволяет полностью отказаться от услуг диктора и предзаписи звуковых роликов в IVR-меню, то есть написанный текст моментально преобразуется в звукозапись и озвучивается клиенту в телефонную линию.

Также, используя синтезированные голоса, можно озвучивать книги, видеоролики, записывать голосовые открытки без потери «естественной» интонации. Voicefabric гарантирует грамотную расстановку ударений, правильное чтение сокращений, чисел, аббревиатур.

Вы можете зарегистрироваться на сайте voicefabric.ru и получить бесплатные секунды синтеза, а также доступ к программному интерфейсу сервиса.