Справка по использованию синтезатора речи «Капитан»

(Черновой вариант)
Дата публикации:17.06.2013
Поделиться в Twitter Поделиться в F******k Поделиться в VKontakte Поделиться в Telegram Поделиться в Mastodon

Синтезатор речи «Капитан» предназначен для использования на устройствах с операционной системой Android версии 4.0 и выше. Синтезатор поддерживает синтез следующих языков:

  • русского;
  • украинского (на основе русской фонемной базы);

Также синтезатор способен читать латинский текст по правилам чтения английского языка (псевдо-английский) или в двухголосом режиме передавать латинский текст для чтения синтезатору Espeak (который должен быть предварительно установлен в системе).

Запуск диалога Captain Tts

Для запуска диалога настроек синтезатора необходимо на домашнем экране активировать значок "Приложения", а затем найти и активировать значок "Captain Tts". После этого откроется диалог со следующими кнопками:

  • Настройки Капитана (открывает диалог с такими параметрами, как варианты чтения чисел, символов пунктуации, латинского текста и т.п.);
  • Общие настройки (открывает диалог общих настроек синтеза речи);
  • Страница Espeak (открывает страницу для установки синтезатора Espeak из магазина Google Play);
  • On-line справка (открывает эту страницу в браузере).

Настройки Капитана

Если нажать на кнопку "Настройки Капитана", то откроется диалог со списком следующих опций:

  • обработка чисел (позволяет выбрать один из вариантов чтения чисел);
  • обработка пунктуации (позволяет выбрать уровень чтения символов пунктуации и других небуквенных символов);
  • обработка латинского текста (позволяет выбрать варианты чтения латинского текста: по правилам латиницы, псевдо-английский вариант и двухголосое чтение в паре с синтезатором Espeak);
  • разрешить изменение высоты тона (позволяет разрешить или запретить изменение высоты тона, которое программы чтения экрана могут использовать для обозначения контекста, в котором озвучивается текст);
  • загружать пользовательский словарь (позволяет разрешить или запретить использование словаря для коррекции чтения некоторых слов).

Пользовательский словарь

Пользовательский словарь применяется для коррекции чтения тех слов и сочетаний букв, которые, по мнению пользователя, синтезатор озвучивает неправильно или неразборчиво. Словарь - это обычный текстовый файл с именем dict.txt, который размещается в каталоге captaintts-data. Этот каталог автоматически создаётся либо в памяти устройства, либо на внешней карте памяти при установке синтезатора.

Файл dict.txt содержит пары из двух последовательностей символов: заменяемой и заменяющей. Используемая кодировка текста utf-8. Каждая пара размещается на отдельной строке, пустые строки игнорируются, а строки, начинающиеся с символа решётка (#) или точка с запятой (;), считаются комментариями.

Каждая строка, содержащая заменяемую и заменяющую последовательности, должна начинаться с символа разделителя (например, с точки). После символа-разделителя должна идти заменяемая последовательность, после которой должен опять помещаться символ-разделитель. Затем должна идти замещающая последовательность. Например:

.чт.четверг

Такая запись означает, что если будет встречено слово из двух букв "чт", то оно будет заменено на слово "четверг" с учетом регистра букв в замещаемом слове.

Если нужно выполнять замену без учета регистра букв, то необходимо после замещающей последовательности добавить символ-разделитель и латинскую букву i. Например:

.чт.четверг.i

Если необходимо выполнять замену не слова целиком, а его части (несколько начальных, конечных или центральных символов), то необходимо использовать символ звёздочки (*). Например:

.булочн*.булошн

Символ звёздочки может быть помещён либо только в начало, либо только в конец, либо и в начало, и в конец замещаемой последовательности.

Пример словаря можно получить, перейдя по ссылке dict.txt.

Чтение символов пунктуации и других небуквенных символов

Кроме файла словаря dict.txt в каталоге /sdcard/captaintts-data/ могут размещаться файлы, управляющие чтением символов пунктуации и других небуквенных символов. Для каждого из поддерживаемых языков необходим свой файл:

  • ru_symbols.txt - для русского;
  • uk_symbols.txt - для украинского.

Формат вышеназванных файлов похож на формат файла словаря, но имеет некоторые отличия. Файлы, определяющие чтение символов пунктуации, это обычные текстовые файлы в кодировке utf-8. На каждой строке такого файла располагается правило чтения одного символа; пустые строки и строки, начинающиеся символами # (решетка) или ; (точки с запятой), игнорируются.

Строка с правилом начинается с символа, который будет восприниматься в качестве символа-разделителя полей. Затем идёт символ, чтение которого определяется в данном правиле. Затем следует символ-разделитель (т. е. ровно тот же символ, что стоит в начале строки). Далее идёт название символа, т.е. текст, который будет озвучиваться синтезатором, когда он встретит этот символ в текстовом потоке. Затем снова следует символ-разделитель. И завершает строку так называемый уровень пунктуации, обозначаемый одним из зарезервированных слов (none, some, most, all). Уровень пунктуации определяет, начиная с какого режима чтения пунктуации, синтезатор будет озвучивать данный символ. Если указан уровень none, то символ озвучивается всегда (т.е. даже при отключенном чтении пунктуации). Если выбран уровеньsome, то символ озвучивается в режимах "некоторая", "большинство" и "вся". Символ с уровнем пунктуации most будет озвучиваться в режимах "большинство" и "вся". Символ с уровнем пунктуации all будет озвучиваться только в режиме чтения всей пунктуации. Действующий режим чтения пунктуации можно посмотреть и настроить в диалоге настроек синтезатора.

Примеры записи некоторых правил:

._.подчёрк.none
.!.воскл!.most

Внимание! Программа чтения экрана TalkBack от версии к версии все большее число символов пытается озвучивать сама (особенно при посимвольном вводе). Это приводит к тому, что одни и те же символы в одних ситуациях поступают на синтезатор без изменений, а в других заменяются на соответствия, которые за ними закрепили разработчики TalkBack. В итоге пользователь слышит, что один и тот же символ читается по-разному. Этот эффект также надо принимать во внимание, если правила, прописанные в файлах ru-symbols.txt или uk_symbols.txt, не работают. Вполне возможно, что к синтезатору этот символ в своём оригинальном виде уже не попадает.



Распространение материалов сайта означает, что распространитель принял условия лицензионного соглашения.
Идея и реализация: © Владимир Довыденков и Анатолий Камынин,  2004-2024