Текстовый читатель. Озвучка и чтение текста голосом онлайн

Текстовый читатель. Озвучка и чтение текста голосом онлайн

23.06.2019

Я расскажу о том, как сделать субтитры или закадровую озвучку для небольшого видео ролика, используя те инструменты, которые есть почти в каждом доме.

В этой статье ты, дорогой читатель, не найдёшь советов о том, какой микрофон лучше выбрать. С этим вопросом я рекомендую прочесть посты Микрофоны, микрофоны и еще раз микрофоны. Часть #1 , Микрофоны, взгляд подкастера #2 и Микрофоны, 3й взгляд подкастера , которые находятся на Хабре.

Если тебе понравилось короткое видео, но ты не можешь показать его своим друзьям, потому что они до сих пор не знают английского/испанского/немецкого/любого другого языка, то именно здесь я расскажу тебе, как создать субтитры для просмотра видео, а если осмелишься, то сможешь и озвучить ролик самостоятельно, без надобности тратить 100 американских рублей на микрофон, и ещё больше тех-же американский рублей на софт обработки звука.

Итак, раз ты здесь, мой друг, значит тебе интересна эта тема, и я начну.

Перечень устройств/программ, которые понадобятся для озвучки:

Создание субтитров.

Как я уже писал, для их создания можно использовать программу Aegisub . На официальной странице загрузок есть возможность скачать русификацию интерфейса, но я так и не смог его настроить. Но это не помешает освоить программу - всё интуитивно просто.

Перво-наперво нужно открыть видео-файл, для которого мы будем создавать субтитры. Выбираем в меню пункт «Video», а в нём «Open Video…», и в открывшемся диалоге открываем наш файл.

После выбора он появляется в левой верхней области окна. Но это ещё не всё. Если сейчас нажать на «Play» (т.е. включить видео), то оно будет без звука. Это не удобно для нас, поэтому нужно добавить звук. Сделать это можно через пункт меню «Audio» -> «Open Audio from Video».

Таким образом, мы получим следующее окно:

  • красное - время начала текущего текста
  • зелёное - время окончания текущего текста
  • жёлтое - отображаемый текст
  • синее - список всех текстов, с указанием времени действия

Итак, начинаем создавать субтитры. Слева, над синей областью есть три клавиши. Нажимаем на первую из них, «Play». Как только мы слышим текст, нажимаем на паузу. Обычно речь начинается не с первой секунды видео - сначала идёт заставка, или просто музыка. Поэтому мы начинаем создавать субтитры не с первой секунды.

Итак, мы нажали на паузу, и видим, с какой именно секунды начинается речь. Указываем это время в красном поле. После этого можно продолжить игру видео, и записать текст, который должен отображаться в субтитрах в жёлтую область. Когда фраза будет логически завершена, указываем в красном поле время, когда фразу следует скрыть с экрана.

Теперь можно переходить ко второй фразе. В синей области экрана нажимаем правой клавишей мышки на текущей строчке субтитров, и выбираем там пункт «Insert (after)». Появится вторая строка, у которой время начала будет равно времени окончания предыдущей строки.

Повторяем ввод текста и добавление строк до тех пор, пока не введём все необходимые субтитры.

Приведу скриншот проекта, который я делал последним.

Если вдруг в процессе создания видео время одних субтитров будет перекрывать другие, то программа подсветит «конкурирующие» строчки красным, и нужно будет выровнять их время показа.

Кроме того, текст сразу отображается поверх видео, и ты можешь оценить результат своей работы.

В целом, у программы богатый функционал, но я не буду его описывать - основные моменты я указал, в остальном, я надеюсь, ты сможешь разобраться.

Сохраняя проект в формате этой программы, ты не сможешь подключить этот файл ко всем проигрывателям, и не сможешь загрузить его на YouToube. Для этого субтитры нужно экспортировать. Нажимаем в меню «File» -> «Export Subtitles…», откроется окно, в котором тоже нажимаем клавишу «Export», и указываем файл для субтитров (обязательно указываем в имени файла расширение, я использую субтитры в формате srt, они нормально загружаются на YouToube).

Пожалуй это всё, что я могу рассказать о создании субтитров.

Создание звука.

  • удаление шума
  • нормализация
  • изменение громкости
  • автоприглушение

Но, обо всём по порядку.

Прежде всего, нужно освободить комнату от всех посторонних друзей/родственников. Первые 5-10 дублей, вероятно, вы будете смеяться вместе с ними, но затем это очень раздражает, мешает сосредоточиться, и нормально записать свой голос.

Далее, нажимаем на красную кнопку на верхней панели программы - запись началась. После этого переключаемся на программу субтитров, и там тоже запускаем воспроизведение видео. Текущая строка субтитров подсвечивается жетловатым цветом, и я всегда знаю, где именно я нахожусь в тексте, что было перед этим и что будет дальше. Это очень важный момент, поверьте.

Конечно, ты заметил, что между включением записи и стартом видео произошла заминка на время переключения между программами. Это совершенно не важно, и в дальнейшем я покажу, как избавиться от этого промежутка пустоты.

Итак, два скриншота. Первый показывает положение окон на рабочем столе перед стартом записи.

И второй, показывает мой экран сразу после начала записи.

Пока что нас не очень волнует то, что происходит в диктофоне. Пускай потихоньку пишет. Если твой голос будет звучать слишком тихо - не вздумай ничего сейчас менять. Обрабатывать звук можно будет только после того, как вся звуковая дорожка будет подготовлена, иначе разрывы между дублями будут слишком заметны на слух.

Итак, мы записали около 30 секунд текста, и голос начал «проседать» - заикаться, путать буквы и тому подобное. Совсем не обязательно начинать всё с начала, можно просто продолжить запись.

Для этого:


После этого, чтобы продолжить запись, нам останется только повторить действия с началом записи. При этом, рекомендую видео ставить на начало предыдущих субтитров (на скриншоте с 22-й секунды), и когда видео подойдёт к 27-й - нажимать на красную кнопку в диктофоне.

В итоге мы получим несколько дорожек на всю длину видео ролика. (на средней панели диктофона есть очень полезная крайняя кнопка с лупой, позволяющая уместить весь проект в ширину окна)

Однако, нам нужно работать с ними как с одной, поэтому выбираем в меню «Дорожки» -> «Свести в последнюю дорожку».

Обработка звука

Итак, у нас есть единая звуковая дорожка. Начинаем её причёсывать.

Прежде всего нужно нормализовать звук.

«Эффекты» -> «Нормировка сигнала». Все параметры оставляем как есть, просто нажимаем «Ок».

Бывает, после нормализации остаются «петухи», из за которых весь звук слышится достаточно тихо. На скриншоте пример такого «петуха»:

Для борьбы с такими моментами можно использовать инструмент из меню «Эффекты» -> «Усиление сигнала» (обязательно нужно выделить этот фрагмент аудио, чтобы эффект применялся только к нему).

Я указал значение «-3,8», после чего убрал выделение и опять применил нормализацию.

Получил такую картинку:

Как можно увидеть на скрине (или прослушать, если ты уже успел записать образец), звук полон посторонних шумов.

У этого диктофона есть функция как раз для этой ситуации.

Сначала нужно создать образец шума, который мы будем удалять:

  • выделяем фрагмент дорожки, где нет нашего голоса (только посторонние шумы)
  • выбираем в меню «Эффекты» -> «Удаление шума»
  • в открывшимся окне нажимаем кнопку «Создать модель шума»
  • снимаем выделения
  • опять выбираем в меню «Эффекты» -> «Удаление шума»
  • нажимаем «ОК»

В результате получим такую чистую дорожку:

Согласись, теперь звук намного приятнее, да и выглядит получше =)

Однако, ещё остались случайные щелчки, шумы (а у меня перед каждой фразой слышится ещё и придыхание, как я набираю воздух в лёгкие).

Избавиться от этого проще простого. Выделяем фрагмент, который нужно убрать, и выбираем в меню «Создание» -> «Тишина…» -> «ОК».

К примеру, я убрал в начале звук клавиатуры от переключения между окнами и нажатия кнопки «Play» на видео.

Сохраняем проект в диктофоне, пока что мы с ним закончили.

Получение аудио дорожки из видео

Однако, я считаю признаком хорошего тона звучание оригинала в фоне (только если оно не перекрывает полностью мой голос), ведь я не могу передать все те эмоции, которые задумал автор ролика, и этот диктофон позволяет очень удобно понизить уровень громкости оригинальной дорожки, и возвращать его в тех местах, где я молчу.

Я использую программу avitomp3 для получения файла mp3 из видео-файла. Уверен, в этой части многие могут пойти своим путём, главное чтобы в результате мы получили аудио-дорожку в mp3 файле.

Пользоваться программой просто - нажимаем кнопку «Add», выбираем наш файл, указываем параметры аудио-файла (рекомендую сразу сохранять в моно-канале, для домашнего видео будет вполне нормально), папку сохранения и нажимаем на большую круглую кнопку со стрелками справа внизу.

Создаём микс из двух дорожек

Итак, возвращаемся к нашей записи. На скриншоте я вместо примера взял свою реальную работу по озвучиванию. Необходимо добавить к уже существующей дорожке ту запись, которую мы только что извлекли из видео-файла.

Сделать это можно пунктом меню «Файл» -> «Импортировать» -> «Звуковой файл…»

Если помнишь, я просил не заострять внимание на том моменте, что запись твоего голоса начинается раньше начала воспроизведения видео?

Пришла пора с этим разобраться.

Обычно, видя две дорожки сразу, удаётся прямо на глаз определить, где идёт отставание нашей дорожки от видео.

Верхняя дорожка из видео файла, нижняя - та, что я записал на микрофон.

Я выделил на нижней дорожке время отставания моего голоса от того момента, когда начинается речь на оригинальном видео. Внизу можно увидеть, что выделение начинается с позиции 6 секунд и 321 миллисекунд, и этот кусок составляет 950 миллисекунд.

Теперь нам нужно эти 950 миллисекунд вырезать из начала файла. Для этого просто записываем вместо цифры 6,321 нули, и наше выделение перемещается в начало файла.

Теперь, для удаления этого отрезка, достаточно применить уже знакомую нам операцию «Правка» -> «Remove Audio or Labels» -> «Удалить».

Дорожку из видео файла нужно переместить выше нашей звуковой дорожки, и выделить её целиком. После этого применяем «Эффекты» -> «Автоприглушение…»

Настройки указываем такие, как у меня на скрине:

И получаем вот такие изменения в дорожке из видео:

Это последний этап работы с нашей звуковой дорожкой. Теперь можно сохранить сам файл проекта (если в будущем ты планируешь что-то в нём изменять), и экспортировать эти две дорожки в mp3-файл.

Экспортировать можно соответственно через меню «Файл» -> «Экспортировать».

Замена дорожки в видео-файле

Наконец пришла пора последнего приложения в моём списке. Открываем VirtualDubMod.
Открываем наш видео-файл. «File» -> «Open video file…».
Указываем, что с видео нам ничего делать не нужно. Делаем это, выбирая в меню «Video» -> «Direct stream copy».
И теперь начинаем работу с аудио-дорожками. Заходим в меню «Streams» -> «Stream list».
Сейчас у нас там одна дорожка, из видео-файла. Нажимаем справа внизу кнопку «Disable» для того, чтобы отключить её.
И добавляем наш файл mp3, используя кнопку «Add».

У некоторых пользователей может возникнуть необходимость в озвучке текста мужским голосом онлайн. Это может быть какой-либо рекламный текст, беллетристика, другие текстовые жанры и стили, которые необходимо трансформировать по принципу «текст в голос», не прибегая к загрузке на ПК различных программ. В этом материале я расскажу, какие существует онлайн говорилки с мужским голосом на русском языке, приведу описание соответствующих сетевых ресурсов, а также поясню, как с ними работать.

Если вас интересует говорилка онлайн, тогда сразу замечу, что в большинстве случаев возможность бесплатного воспроизводства текста ограничена размером в несколько сот символов, за полный же функционал придётся доплачивать. Это связано с рекламным характером подобных ресурсов, призванных, скорее, продемонстрировать возможности голосового движка, нежели полноценно озвучивать мужским голосом огромные объёмы пользовательского текста.

Итак, перейдём к непосредственному перечислению и описанию возможностей нужных нам сетевых диктор-ресурсов.

Ресурс Linguatec для чтения текста голосом

Первая говорилка онлайн с мужским и женским голосом, о которой я хочу рассказать – это немецкий ресурс Linguatec . Максимальный объём текста, который может быть озвучен, ограничен 250 символами, чего, впрочем, вполне достаточно для демонстрации возможностей указанного голосового движка. За полноценный же функционал без ограничений придётся заплатить реальные деньги.

Чтобы воспользоваться возможностями ресурса перейдите на него, в табличке «Voice Reader» выберите русский язык (Russisch), а чуть ниже, из представленных голосов, выберите мужской голос (Yuri). Ниже введите нужный вам текст (до 250 символов) и нажмите кнопку со стрелочкой (Play).

Oddcast — онлайн синтезатор речи

Ресурс Oddcast также может выступать как online говорилка, при этом размер проговариваемого текста ограничен 170 символами.

  1. Для работы с данным ресурсом перейдите на него, в окне выбора языка (Language) выберите Russian, а в окне выбора мужского или женского голоса выберите мужской (Dmitri).
  2. В окне «Enter text» введите ваш текст, а затем нажмите на кнопку «Say It» (сказать это).
  3. Включенная в функционал движка опция «Effect» даст вам возможность поэкспериментировать над различными звуковыми эффектами (шепот, роботизированный голос, ускоренный голос и так далее).

iSpeech — сервис воспроизводит текст в речь

Ещё один ресурс, под названием iSpeech , обладающий русским голосовым движком довольно хорошего качества. При этом объём воспроизводимого текста также ограничен цифрой в около 200 символов, позволяя озвучить русский текст мужским голосом онлайн.

Для работы с ресурсом перейдите на него, в списке языков слева найдите «Russian Male», в окне справа введите ваш текст и нажмите на кнопку «Play» (придётся подождать несколько секунд, пока система обработать текст).

Если сервис iSpeech вам не подошёл перейдите на статью об или читайте далее.

Ресурс IVONA читает любой текст вслух

Ещё одна онлайн говорилка с мужским голосом на русском языке – это IVONA . Данный ресурс обладает одним из наиболее качественных голосовых движков, при этом имеющаяся до недавнего времени возможность проговаривать некий бесплатный объём текста на данный момент не доступна (возможно, будет доступна позже)

Тем не менее, возможность демонстрации возможностей имеющегося голосового движка осталась. Для этого необходимо перейти на данный ресурс Ивона, в списке имеющихся языков найти «Russia», кликнуть на кнопочку справа, и, выбрав мужской голос (Maxim), нажать на кнопку со стрелочкой (Play).

Ещё немного о стандартах голосовых движков

Что относится к имеющимся сегодня основным стандартам голосовых движков, то ныне наиболее распространены два из них – SAPI 4 и SAPI 5 («SAPI» это аббревиатура от «Microsoft Speech API» — в переводе «Интерфейс программирования речи от Microsoft»). SAPI 4 является устаревшим стандартом, созданным ещё в 1998 году, ныне применяется мало, SAPI 5 – более современен, обладает более качественным произношением, последняя модификация — SAPI 5.4 (при этом у SAPI 5 бесплатных голосов меньше, нежели у устаревшего SAPI 4).

Что до программ синтеза речи, то одна из наиболее популярных из них — «Govorilka », позволяет довольно качественно озвучивать объёмные тексты, причём различными вариантами голосов (как мужских, так и женских). В инсталляционной версии продукта обычно находится комплект из нескольких встроенных голосов, если же читателю их будет мало, то на сайте программы можно скачать дополнительные голоса к ней (в том числе качественные платные варианты).

Заключение

Если вас интересует говорилка с мужским голосом на русском языке, тогда рекомендую обратить внимание на список сетевых онлайн ресурсов, перечисленных мной выше. При этом к их недостаткам стоит отнести ограниченность их бесплатного функционала, вынуждая пользователя обращать пристальное внимание на специализированные программы (к примеру, «Говорилка»). Наиболее же качественное произношение среди перечисленных ресурсов даёт голосовой движок сервиса IVONA, и именно озвученные им фразы мы довольно часто встречаем в русскоязычном сегменте сети.

Вконтакте

Здравствуйте!

«Хлеб питает тело, а книга питает разум»…

Книги - одно из самых ценных богатств современного человека. Появились книги еще в древние времена и стоили очень дорого (одну книгу можно было поменять на стадо коров!). В современном же мире - книги доступны всем! Читая их, мы становимся более грамотны, развивается кругозор, смекалка. Да и вообще, пока еще не придумали более совершенного источника знаний для передачи друг другу!

С развитием компьютерных технологий (особенно в последние 10 лет) - стала возможно не только читать книги, но и слушать их (т. е. читать их вам будет специальная программа, мужским или женским голосом). Я бы хотел рассказать вам о программных инструментах для озвучки текста.

Возможные проблемы при записи

Прежде, чем перейти к списку программ, хотелось бы остановиться на распространенной проблеме и рассмотреть случаи, когда программа не может прочитать текст.

Дело в том что есть голосовые движки, они могут быть разных стандартов: SAPI 4, SAPI 5 или Microsoft Speech Platform (в большинстве программ для воспроизведения текста есть выбор этого инструмента). Так вот, логично, что помимо программы для чтения голосом - нужен движок (от него будет зависеть, на каком языке вам будут читать, каким голосом: мужским или женским и пр.).

Речевые движки

Движки могут быть бесплатными и коммерческими (естественно, что лучшее качество воспроизведения звука обеспечивают коммерческие движки).

SAPI 4. Устаревшие версии инструментов. Для современных ПК не рекомендуется использовать устаревшие версии. Лучше присмотреться к SAPI 5 или Microsoft Speech Platform.

SAPI 5. Современные речевые движки, есть как бесплатные, так и платные. В интернете можно найти десятки речевых движков SAPI 5 (и с женским и с мужским голосом).

Одна из самых лучших программ для озвучивания текста. Позволяет вашему ПК читать не только простые файлы в формате txt, но и новости, RSS, любые веб-страницы в интернете, электронную почту и пр.

Кроме того, позволяет преобразовать текст в mp3 файл (который вы потом можете загрузить на любой телефон или mp3 плеер и слушать в дороге, например). Т.е. вы можете самостоятельно создавать аудио-книги!

Голоса программы IVONA очень похожи на реальные, достаточно не плохое произношение, не запинаются. Кстати, программа может быть полезна для тех, кто изучает иностранный язык. Благодаря ней можно слушать правильное произношение тех или иных слов, оборотов.

Поддерживает SAPI5, плюс к этому хорошо кооперируется с внешними приложениями (например, Apple Itunes, Skype).

Пример (запись одной моей недавней статьи)

Из минусов: некоторые незнакомые слова читает с неправильным ударением и интонацией. В целом же весьма не плохо, чтобы прослушать, например, параграф из книги по истории, пока идешь на лекцию/занятие - даже более чем!

Балаболка

Отличная программа для работы с книгами: чтение, каталогизирование, поиск нужной и пр. Помимо стандартных документов, которые могут читать и другие программы (TXT-HTML, HTML-TXT, TXT-DOC, DOC-TXT, PDB-TXT, LIT-TXT, FB2-TXT и т.д.) ICE Book Reader поддерживает файлы форматов: .LIT, .CHM и.ePub.

К тому же ICE Book Reader позволяет не только читать, но и отличная настольная библиотека:

  • позволяет хранить, обрабатывать, каталогизировать книги (до 250000 тысяч экземпляров!);
  • автоматическое упорядочивание вашей коллекции;
  • быстрый поиск книги из вашей «свалки» (особенно актуально, если у вас много не каталогизированной литературы);
  • ядро базы данных ICE Book Reader превосходит большинство программ подобного рода.

Также программа позволяет озвучивать тексты голосом.

Для этого нужно зайти в настройки программы и настроить две вкладки: «Режим»(выбрать чтение голосом) и «Режим синтеза речи» (выбрать непосредственно сам речевой движок).


Говорилка

Основные возможности программы «Говорилка»:

С помощью Sakrament Talker можно превратить свой компьютер в «говорящую» аудио книгу! Программа Sakrament Talker поддерживает форматы RTF и TXT,может автоматически распознавать кодировку файла (наверное, иногда замечали, что некоторые программы открывают файл с «крякозабрами» вместо текста, так вот в Sakrament Talker такое невозможно!).

Кроме того Sakrament Talker позволяет воспроизводить достаточно большие файлы, быстро находить те или иные файлы. Озвученный текст можно не только прослушать на компьютере, но и сохранить в mp3 файл (который в последствии можно скопировать на любой плеер или телефон и прослушивать вдалеке от ПК).

В целом довольно не плохая программа, которая поддерживает все популярные голосовые движки.

На этом сегодня все. Несмотря на то, что сегодняшние программы еще не могут в полной мере (качественно на 100%) читать текст так, чтобы человек не мог определить кто это читает: программа или человек… Но считаю, что к этому когда-нибудь программы дойдут: мощности компьютеров растут, движки растут в объеме (включая все новые и новые даже самые сложные обороты речи) - а значит, достаточно скоро звук от программы будет не отличим от обычной речи человека?!вв

Программа "" предназначена для чтения вслух текстовых файлов. Для воспроизведения звуков человеческого голоса могут использоваться любые речевые синтезаторы, установленные на компьютере. Воспроизведение речи можно контролировать при помощи стандартных кнопок, подобных тем, что присутствуют в любой мультимедийной программе ("воспроизвести", "пауза", "стоп"). Приложение умеет читать вслух содержимое буфера обмена, показывать текст, содержащийся в документах, изменять настройки шрифта и цвета, управлять процессом чтения из системного трея (области уведомлений) или при помощи глобальных сочетаний клавиш, произносить набираемый на клавиатуре текст, проверять орфографию, делить текстовый файл на несколько файлов меньшего размера, искать омографы. "" предоставляет возможность удалить из текста все знаки переноса на концах строк; это позволит избежать запинок при чтении слов. Поддерживаются форматы файлов: AZW, AZW3, CHM, DjVu, DOC, DOCX, EML, EPUB, FB2, FB3, HTML, LIT, MOBI, ODP, ODS, ODT, PDB, PDF, PPT, PPTX, PRC, RTF, TCR, WPD, XLS, XLSX.


Размер файла: МБ
Версия: История изменений
Тип лицензии: Freeware
Операционная система:
Языки интерфейса: русский, английский, арабский, армянский, болгарский, венгерский,
вьетнамский, голландский, греческий, испанский, итальянский, китайский,
корейский, немецкий, персидский, польский, португальский, румынский,
сербский, словенский, турецкий, украинский, финский, филиппинский,
французский, хорватский, чешский, японский
Файлы справки: русский, английский, испанский, итальянский, корейский, немецкий,
украинский, французский, чешский

Portable-версия: Загрузить (МБ)
Переносимая (portable) версия "Балаболки" не требует инсталляции и может запускаться с "флешки".
На компьютере должен быть установлен хотя бы один синтезатор речи (голос).

Консольное приложение: Загрузить (КБ)
Консольное приложение не имеет графического интерфейса и выполняется в текстовом режиме.
Режим работы может быть задан при помощи параметров командной строки или файла конфигурации.

Утилита для извлечения текста из файлов: Загрузить (МБ)
Программа позволяет извлекать текст из файлов различных форматов.
Утилита не имеет графического интерфейса и выполняется в текстовом режиме.

Всё ещё непонятно, зачем нужна такая программа? Вот полезные ссылки по теме:

Программа "" позволяет изменять ее внешний вид при помощи тем оформления.




Программа может использовать компьютерные голоса, поддерживающие SAPI 4, SAPI 5 или Microsoft Speech Platform. Существуют бесплатные и платные (коммерческие) речевые движки. Самое высокое качество синтеза речи обеспечивают коммерческие голоса.

Речевые синтезаторы производства фирмы RealSpeak (бесплатные голоса, были опубликованы на сервере компании Microsoft):

  • Британский английский (19,4 МБ)
  • Испанский (21,7 МБ)
  • Итальянский (21,5 МБ)
  • Немецкий (20,7 МБ)
  • Французский (22,5 МБ)

Ольга Яковлева разработала многоязычный синтезатор речи с открытым исходным кодом RHVoice (доступны русский, английский, грузинский, киргизский, татарский, украинский языки и эсперанто):

  • Описание синтезатора речи
  • Версия для Windows

Ярослав Козак из Львова создал украинский синтезатор речи UkrVox . За основу был взят голос диктора украинского радио Игоря Мурашко.

  • UkrVox
  • Nuance (demo)

Из коммерческих речевых синтезаторов интерес для российских пользователей представляют следующие голоса:

  • Alyona (Acapela Group)
  • Katya , Milena и Yuri (Nuance)
  • Nicolai (Digalo - Acapela Elan Speech Cube)
  • Tatyana и Maxim (IVONA)

Microsoft Speech Platform


Microsoft Speech Platform (версия 11.0) – набор инструментов, позволяющих разработчикам строить решения с распознаванием голоса и преобразованием текста в речь.

Для работы синтезатора речи необходимо загрузить и установить следующие компоненты:

  1. Microsoft Speech Platform - Runtime – серверная часть платформы, предоставляющая API для программ (файл x86_SpeechPlatformRuntime\SpeechPlatformRuntime.msi).
  2. Microsoft Speech Platform - Runtime Languages – набор языков для серверной части. На данный момент предлагаются голоса для 26 языков, в том числе русский голос Elena (файлы, чьи имена начинаются с "MSSpeech_TTS_").

Теги (управляющие команды), которые используются для голосов SAPI 5, могут применяться и для голосов Microsoft Speech Platform. Но следует помнить, голоса SAPI 5 и голоса Microsoft Speech Platform несовместимы друг с другом, поэтому нельзя переключаться между ними при помощи тегов Voice или Lang.

Коррекция произношения


Пользователь может использовать специальный список замен для улучшения качества воспроизведения речи. Это полезно в тех случаях, когда есть необходимость изменить произношение слов или отдельных слогов; для этого некоторое выражение в тексте заменяется на необходимое читаемое выражение. Для записи подобных правил замены используется синтаксис регулярных выражений ; списки замен хранятся в файлах с расширением *.rex.

По просьбам российских пользователей была добавлена поддержка словарей для коррекции произношения с расширением *.dic. Этот формат словарей использовался в программе "Говорилка". Простые правила замены применяются к тексту быстрее, чем регулярные выражения.

Формат *.bxd объединяет достоинства двух других форматов. Словарь может содержать как регулярные выражения, так и правила для простой замены текста. В специальном редакторе можно создавать отдельные словари как для выбранного компьютерного голоса, так и для конкретного языка.

Файлы словарей находятся в папке "Документы\Balabolka " ("Мои документы\Balabolka " в Windows XP).

Проверка орфографии


Программа "" поддерживает Hunspell (hunspell.github.io). Hunspell - это система проверки орфографии, предназначенная для языков со сложной системой словообразования и обширной морфологией. Hunspell используется в пакетах офисных приложений OpenOffice.org и LibreOffice, а также в браузере Mozilla Firefox.

Словари для Windows можно скачать отсюда:

В этой статье ты, хабр, не найдёшь советов о том, какой микрофон лучше выбрать. С этим вопросом я рекомендую прочесть посты Микрофоны, микрофоны и еще раз микрофоны. Часть #1 , Микрофоны, взгляд подкастера #2 и Микрофоны, 3й взгляд подкастера .
Ещё ты здесь не найдёшь советов о качестве роликов. Если тебе нужно качество, рекомендую почитать годную статью Попытка перевода и озвучки видео в домашних условиях .

Бывают ситуации, когда тебе очень нравится то или иное видео, но ты не можешь показать его своим друзьям, потому что они до сих пор не знают английского/испанского/немецкого/любого другого языка. Но ведь ты его знаешь, и как минимум можешь сделать субтитры для просмотра видео, а может быть даже замахнёшься на озвучку дубляжа, без надобности тратить 100 американских рублей на микрофон, и ещё больше тех-же американский рублей на софт обработки звука.
Я расскажу о том, как сделать субтитры или дубляж на том, что есть почти в каждом доме.

Итак, раз уж ты здесь, хабрапользователь, позволь мне начать.
Перечень устройств/программ, которые понадобятся для озвучки:

Создание субтитров.

Как я уже писал, для их создания можно использовать программу Aegisub . На официальной странице загрузок есть возможность скачать руссификацию интерфейса, но я так и не смог его настроить. Но это не помешает освоить программу - всё интуитивно просто.

Перво-наперво нужно открыть видео-файл, для которого мы будем создавать субтитры. Выбираем в меню пункт «Video», а в нём «Open Video…», и в открывшемся диалоге открываем наш файл.
После выбора он появляется в левой верхней области окна. Но это ещё не всё. Если сейчас нажать на «Play» (т.е. включить видео), то оно будет без звука. Это не удобно для нас, поэтому нужно добавить звук. Сделать это можно через пункт меню «Audio» -> «Open Audio from Video».
Таким образом, мы получим следующее окно:

  • красное - время начала текущего текста
  • зелёное - время окончания текущего текста
  • жёлтое - отображаемый текст
  • синее - список всех текстов, с указанием времени действия

Итак, начинаем создавать субтитры. Слева, над синей областью есть три клавиши. Нажимаем на первую из них, «Play». Как только мы слышим текст, нажимаем на паузу. Обычно речь начинается не с первой секунды видео - сначала идёт заставка, или просто музыка. Поэтому мы начинаем создавать субтитры не с первой секунды.
Итак, мы нажали на паузу, и видим, с какой именно секунды начинается речь. Указываем это время в красном поле. После этого можно продолжить игру видео, и записать текст, который должен отображаться в субтитрах в жёлтую область. Когда фраза будет логически завершена, указываем в красном поле время, когда фразу следует скрыть с экрана.
Теперь можно переходить ко второй фразе. В синей области экрана нажимаем правой клавишей мышки на текущей строчке субтитров, и выбираем там пункт «Insert (after)». Появится вторая строка, у которой время начала будет равно времени окончания предыдущей строки.
Повторяем ввод текста и добавление строк до тех пор, пока не введём все необходимые субтитры.
Приведу скриншот проекта, который я делал последним.

Если вдруг в процессе создания видео время одних субтитров будет перекрывать другие, то программа подсветит «конкурирующие» строчки красным, и нужно будет выровнять их время показа.
Кроме того, текст сразу отображается поверх видео, и ты можешь оценить результат своей работы.
В целом, у программы богатый функционал, но я не буду его описывать - основные моменты я указал, в остальном, я надеюсь, ты сможешь разобраться.

Сохраняя проект в формате этой программы, ты не сможешь подключить этот файл ко всем проигрывателям, и не сможешь загрузить его на YouToube. Для этого субтитры нужно экспортировать. Нажимаем в меню «File» -> «Export Subtitles…», откроется окно, в котором тоже нажимаем клавишу «Export», и указываем файл для субтитров (обязательно указываем в имени файла расширение, я использую субтитры в формате srt, они нормально загружаются на YouToube).
Пожалуй это всё, что я могу рассказать о создании субтитров.

Создание звука.

  • удаление шума
  • нормализация
  • изменение громкости
  • автоприглушение

Но, обо всём по порядку.
Прежде всего, нужно освободить комнату от всех посторонних друзей/родственников. Первые 5-10 дублей, вероятно, вы будете смеяться вместе с ними, но затем это очень раздражает, мешает сосредоточиться, и нормально записать свой голос.
Далее, нажимаем на красную кнопку на верхней панели программы - запись началась. После этого переключаемся на программу субтитров, и там тоже запускаем воспроизведение видео. Текущая строка субтитров подсвечивается жетловатым цветом, и я всегда знаю, где именно я нахожусь в тексте, что было перед этим и что будет дальше. Это очень важный момент, поверьте.
Конечно, ты заметил, что между включением записи и стартом видео произошла заминка на время переключения между программами. Это совершенно не важно, и в дальнейшем я покажу, как избавиться от этого промежутка пустоты.
Итак, два скриншота. Первый показывает положение окон на рабочем столе перед стартом записи.

И второй, показывает мой экран сразу после начала записи.

Пока что нас не очень волнует то, что происходит в диктафоне. Пускай потихоньку пишет. Если твой голос будет звучать слишком тихо - не вздумай ничего сейчас менять. Обрабатывать звук можно будет только после того, как вся звуковая дорожка будет подготовлена, иначе разрывы между дублями будут слишком заметны на слух.
Итак, мы записали около 30 секунд текста, и голос начал «проседать» - заикаться, путать буквы и тому подобное. Совсем не обязательно начинать всё с начала, можно просто продолжить запись.
Для этого:

После этого, чтобы продолжить запись, нам останется только повторить действия с началом записи. При этом, рекомендую видео ставить на начало предыдущих субтитров (на скриншоте с 22-й секунды), и когда видео подойдёт к 27-й - нажимать на красную кнопку в диктофоне.
В итоге мы получим несколько дорожек на всю длину видео ролика. (на средней панели диктофона есть очень полезная крайняя кнопка с лупой, позволяющая уместить весь проект в ширину окна)

Однако, нам нужно работать с ними как с одной, поэтому выбираем в меню «Дорожки» -> «Свести в последнюю дорожку».

Обработка звука

Итак, у нас есть единая звуковая дорожка. Начинаем её причёсывать.
Прежде всего нужно нормализовать звук.
«Эффекты» -> «Нормировка сигнала». Все параметры оставляем как есть, просто нажимаем «Ок».
Бывает, после нормализации остаются «петухи», из за которых весь звук слышится достаточно тихо. На скриншоте пример такого «петуха»:

Для борьбы с такими моментами можно использовать инструмент из меню «Эффекты» -> «Усиление сигнала» (обязательно нужно выделить этот фрагмент аудио, чтобы эффект применялся только к нему).
Я указал значение "-3,8", после чего убрал выделение и опять применил нормализацию.
Получил такую картинку:

Как можно увидеть на скрине (или прослушать, если ты уже успел записать образец), звук полон посторонних шумов.
У этого диктофона есть функция как раз для этой ситуации.
Сначала нужно создать образец шума, который мы будем удалять:

  • выделяем фрагмент дорожки, где нет нашего голоса (только посторонние шумы)
  • выбираем в меню «Эффекты» -> «Удаление шума»
  • в открывшимся окне нажимаем кнопку «Создать модель шума»
  • снимаем выделения
  • опять выбираем в меню «Эффекты» -> «Удаление шума»
  • нажимаем «ОК»

В результате получим такую чистую дорожку:

Согласись, теперь звук намного приятнее, да и выглядит получше =)
Однако, ещё остались случайные щелчки, шумы (а у меня перед каждой фразой слышится ещё и придыхание, как я набираю воздух в лёгкие).
Избавиться от этого проще простого. Выделяем фрагмент, который нужно убрать, и выбираем в меню «Создание» -> «Тишина…» -> «ОК».
К примеру, я убрал в начале звук клавиатуры от переключения между окнами и нажатия кнопки «Play» на видео.

Сохраняем проект в диктофоне, пока что мы с ним закончили.

Получение аудио дорожки из видео

Если видео не содержит ничего кроме голоса, и ты не хочешь слышать в фоне звук оригинала, то следующие два пункта можно пропустить.
Однако, я считаю признаком хорошего тона звучание оригинала в фоне (только если оно не перекрывает полностью мой голос), и этот диктофон позволяет очень удобно понизить уровень громкости оригинальной дорожки, и возвращать его в тех местах, где я молчу.

Я использую программу avitomp3 для получения файла mp3 из видео-файла. Уверен, в этой части многие могут пойти своим путём, главное чтобы в результате мы получили аудио-дорожку в mp3 файле.
Пользоваться программой просто - нажимаем кнопку «Add», выбираем наш файл, указываем параметры аудио-файла (рекомендую сразу сохранять в моно-канале, для домашнего видео будет вполне нормально), папку сохранения и нажимаем на большую круглую кнопку со стрелками справа внизу.

Создаём микс из двух дорожек

Итак, возвращаемся к нашей записи. На скриншоте я вместо примера взял свою реальную работу по озвучиванию. Необходимо добавить к уже существующей дорожке ту запись, которую мы только что извлекли из видео-файла.
Сделать это можно пунктом меню «Файл» -> «Импортировать» -> «Звуковой файл…»
Если помнишь, я просил не заострять внимание на том моменте, что запись твоего голоса начинается раньше начала воспроизведения видео?
Пришла пора с этим разобраться.
Обычно, видя две дорожки сразу, удаётся прямо на глаз определить, где идёт отставание нашей дорожки от видео.
Верхняя дорожка из видео файла, нижняя - та, что я записал на микрофон.

Я выделил на нижней дорожке время отставания моего голоса от того момента, когда начинается речь на оригинальном видео. Внизу можно увидеть, что выделение начинается с позиции 6 секунд и 321 миллисекунд, и этот кусок составляет 950 миллисекунд.
Теперь нам нужно эти 950 миллисекунд вырезать из начала файла. Для этого просто записываем вместо цифры 6,321 нули, и наше выделение перемещается в начало файла.
Теперь, для удаления этого отрезка, достаточно применить уже знакомую нам операцию «Правка» -> «Remove Audio or Labels» -> «Удалить».

Дорожку из видео файла нужно переместить выше нашей звуковой дорожки, и выделить её целиком. После этого применяем «Эффекты» -> «Автоприглушение…»
Настройки указываем такие, как у меня на скрине:

И получаем вот такие изменения в дорожке из видео:

Это последний этап работы с нашей звуковой дорожкой. Теперь можно сохранить сам файл проекта (если в будущем ты планируешь что-то в нём изменять), и экспортировать эти две дорожки в mp3-файл.
Экспортировать можно соответственно через меню «Файл» -> «Экспортировать».

Замена дорожки в видео-файле

Наконец пришла пора последнего приложения в моём списке. Открываем .
Открываем наш видео-файл. «File» -> «Open video file…».
Указываем, что с видео нам ничего делать не нужно. Делаем это, выбирая в меню «Video» -> «Direct stream copy».
И теперь начинаем работу с аудио-дорожками. Заходим в меню «Streams» -> «Stream list».
Сейчас у нас там одна дорожка, из видео-файла. Нажимаем справа внизу кнопку «Disable» для того, чтобы отключить её.
И добавляем наш файл mp3, используя кнопку «Add».

При желании можно его загружать на YouToube или любой другой хостинг. Для субтитров указываем файл с расширением *.srt, который мы создавали в самом начале.
Я могу дать ссылку на свой файл , который я делал таким образом. Если не обращать внимание на акцент и на мой нудный голос, то, мне кажется, получилось весьма неплохо.

Возможно, эта статья не соответствует уровню IT сферы хабра, но я не призываю сейчас-же всем идти и записывать профессиональные дубли на основе этой статьи.
Но надеюсь, что эта статья объяснит основные сложности при записи своих переводов, или просто озвучивании видео, и позволит наконец-то сделать ту самую вещь, которую собираешься сделать уже год, но всё никак не выделишь время для изучения вопроса.
Желаю удачи в вашем творчестве, а если есть полезные советы или замечания - с удовольствием прочитаю их в комментариях.



© 2024 beasthackerz.ru - Браузеры. Аудио. Жесткий диск. Программы. Локальная сеть. Windows