Как тупит «Алиса»: обзор голосового помощника от «Яндекс

Как тупит «Алиса»: обзор голосового помощника от «Яндекс

17.07.2019
  • 10 октября 2017 года «Яндекс» официально своего голосового ассистента «Алиса».
  • В основе «Алисы» - нейронные сети, которые распознают речь, интерпретируют её , составляют ответы и синтезируют голос помощника. «Алиса» обучается на огромных массивах текстов, чтобы общаться с пользователем на свободные темы.
  • Есть и «редакторские» реплики, написанные командой для ответов на популярные вопросы.
  • Одна из главных сложностей в разработке такой системы: понять, что будет интересовать пользователей, и как они будут об этом спрашивать. Кто-то спрашивает у поисковика «где я», кто-то - «какая моя геолокация».
  • Основные отличия «Алисы» от конкурентов (к примеру, Siri) - интеграция с собственной поисковой системой компании и наличие нейронной сети, с помощью которой помощник самостоятельно генерирует новые реплики.

Почему «Яндекс» взялся за разработку голосового ассистента

К 2017 году своих голосовых помощников представили крупнейшие мировые ИТ-компании: на англоязычном рынке работает Siri от Apple, Assistant от Google, Alexa от Amazon, M от Facebook, Cortana от Microsoft. На азиатском - Duer от Baidu и Bixby от Samsung.

За создание «Алисы» компания принялась в конце 2016 года. Сервис начали разрабатывать потому, что вся индустрия движется в этом направлении: пользователь хочет и готов решать свои задачи в форме диалога с виртуальным помощником, готовы к этому и алгоритмы, - и можно переходить от голосового ввода к осмысленному диалогу.

Когда у пользователя появляется возможность задать вопрос голосом, он начинает говорить по-человечески. Вместо «Лада калина 2007 карданный вал дёшево купить» спрашивает: «Где мне купить карданный вал на "Ладу Калину" 2007 года»? Не выдумывает поисковый запрос, не формулирует его, как он привык это делать, а просто спрашивает.

В этом направлении параллельно движутся и поисковые алгоритмы, и диалоговые интерфейсы. Но в голосовом помощнике есть привязка к контексту - то есть способность удерживать смысл реплик и понимать, связаны ли с ними последующие высказывания.

Скажем, вы спросили «Алису»: «Какая завтра погода?» - она ответила вам: «+7 и ясно». Следующий вопрос может оказаться: «А на выходных?» Его легко понять человеку, но сложно машине - ведь в нём нет даже ключевого слова «погода». Диалоговый помощник умеет сопоставлять реплики и понимать, что вы всё ещё говорите о погоде.

Илья Субботин

Руководитель продукта «Алиса»

По словам разработчиков, пользователи «Яндекса» уже умеют обращаться к сервисам компании голосом - команда «Слушай, Яндекс» работает и в «Поиске», и в «Навигаторе», и в других приложениях. Так что привыкать к новому интерфейсу им не придётся.

Илья Субботин, руководитель продукта «Алиса»

С пользовательской точки зрения, говорит команда проекта, с появлением «Алисы» меняется несколько вещей. Помимо диалогового интерфейса, помощник обрёл личность - «Алиса» проявляет эмоции, умеет шутить и «не терпит унизительного обращения в свой адрес». К ней теперь можно обращаться по имени: «Слушай, Алиса».

С технологической - за работу помощника теперь отвечает многослойная нейросеть, которая учится на массивах текстов, понимает смысл запроса и самостоятельно синтезирует речь.

Как работает «Алиса»

«Алиса» встроена в поисковое приложение «Яндекса». Общаться с ассистентом можно как голосом, так и вводя запросы с клавиатуры. При возможности «Алиса» отвечает на заданный вопрос прямо в диалоговом интерфейсе, в других случаях - показывает поисковую выдачу по запросу или нужное приложение.

Под капотом

В основе «Алисы» - нейронные сети: они распознают речь, анализируют её, определяют тематику диалога, выделяют полезную для поиска информацию, синтезируют ответы помощника.

Почти все вычисления, помимо голосовой активации (распознавания фразы «Слушай, Алиса»), проводятся в облаке. «Конечно, было бы интересно перенести часть вычислений на смартфон, чтобы "Алиса" иногда могла работать и без интернета, - говорит Илья Субботин. - Но вычислительная мощность смартфонов слишком низкая для таких задач».

Технологии машинного обучения дошли до уровня, когда пользователь может просто говорить с приложением и видеть, что то его понимает, - а синтезированный голос приобретает звучание, близкое к естественному.

Команда «Алисы»

При этом мировое научное и технологическое сообщество находится лишь в начале пути - алгоритмы будут совершенствоваться и дальше. Распознавание речи, синтез, определение тематики беседы - всё это должно работать ещё лучше.

Есть общие продуктовые метрики, по которым можно оценивать работу помощника, - удовлетворенность пользователя, частота использования приложения. Но есть и более сложные параметры, объясняет Субботин. Например, умение находиться в контексте беседы: помощник должен помнить, о чём его спросил пользователь, уметь верно интерпретировать дополнительные вопросы и давать релевантные ответы.

«От релевантности одного конкретного диалога в будущем можно будет переходить к персонализации и мультизадачности: в идеале, когда я собираюсь на работу, я смогу спросить, что надеть, "Алиса" посмотрит погоду, маршрут до офиса, решит, на чем лучше доехать, и исходя из этого посоветует мне, что надеть».

Как объективно оценивать способность системы вести диалог, пока не ясно. Длина диалога мало говорит о его содержательности: беседа может затянуться, если пользователю интересно обсудить что-то с ассистентом или если помощник долго не может решить его задачу. Но и короткий диалог не всегда говорит об успешном решении проблемы.

Акцент на поиске

Разработчики голосового помощника Siri от Apple намеренно наращивают количество диалоговых сценариев - чтобы не демонстрировать пользователю поисковую выдачу. Перед командой «Алисы» такой задачи не стоит, потому что «Алиса» - другой продукт.

Apple поступает так не от богатства выбора. Просто это не поисковая компания. Мы абсолютно другие. Для нас поиск на первом месте - это лучший продукт, который у нас есть.

Загадывать, как интегрированный с поиском помощник будет адаптирован для работы на других устройствах, пока рано, считает руководитель продукта «Алиса»: индустрия пока не выяснила, какие именно устройства окажутся востребованы у аудитории, а кроме того, такие устройства будут предполагать разные сценарии взаимодействия, под которые можно будет адаптировать систему.

«У пользователя в любом случае есть задача, которую он хочет решить - взаимодействуя с голосовой колонкой или, допустим, системой управления автомобилем. В случае с колонкой упор будет сделан, вероятно, на музыке или новостях - и у нас есть музыкальный и новостной сервисы. В автомобиле водителя интересуют карты. Вряд ли он будет спрашивать у машины: "пластиковые окна купить дёшево"».

Крупные технологические компании делают ставку на экосистем «умных» устройств - и это расширяет возможности взаимодействия с помощником. Если для ответа на вопрос устройству без экрана понадобится показать поисковую выдачу или открыть приложение, помощник сможет запустить нужный сервис на другом - например, на смартфоне.

«Это лишь вопрос адаптации под устройство, - продолжает Субботин. Но, по-честному, мы пока ничего не знаем. Один из лидеров отрасли - Amazon, - до сих пор экспериментирует с форматами: у компании есть колонка Echo, мини-версия Echo Dot, варианты с камерой, с экраном».

Личность

Личность «Алисы», считают разработчики, - одно из её главных конкурентных преимуществ. Проекты, рассчитанные на англоязычную аудиторию, не пытаются создать сильную эмоциональную связь с пользователем, а наоборот, скорее от него отстраняются.

Чтобы дать ассистенту личность, команде нужно было определиться с полом, возрастом, именем и чертами характера персонажа, описать поведение и составить реплики, которые помощник будет использовать для диалога с пользователем - «редакторские» ответы.

Вместе с журналистом, писателем и бывшим руководителем группы маркетинга поиска «Яндекса» Владимиром Гуриевым разработчики описали характер персонажа и выбрали для него подходящие реплики.

Всего команда описала около 320 сценариев, в которых помощник отвечает редакторскими репликами. Для каждого из таких сценариев заложено от двух до семи ответов, которые система выбирает случайным образом. «Этого достаточно, чтобы сформировать личность, но недостаточно, чтобы потрепаться обо всём на свете», - говорит Субботин.

Разработчики решили, что ассистент будет молодой девушкой, которая всегда готова помочь владельцу смартфона, но при этом не допускает панибратского отношения. Она корректна и держит дистанцию, когда её пытаются оскорбить, но не высокомерна и не кичится своими знаниями.

Помощник также должен быть ироничным и - это важно в контексте систем искусственного интеллекта - самоироничным. «Дело в том, что наш алгоритм речевого синтеза, - да и все алгоритмы конкурентов, - не очень-то хороши в эмоциях. "Алиса" немножечко над собой посмеивается, добавляя слова "шутка" или "сарказм", где это нужно. Потому что она знает про себя, что пока не может хорошо интонировать», - объясняют разработчики.

Как выбирали имя

Команда составила список имён, которые, как показалось сотрудникам, лучше всего подходили к выбранным чертам характера. К имени предъявлялись также технические требования: например, в нём не должно было быть буквы «р» - её не выговаривают маленькие дети.

Кроме того, имя не должно было входить в другие слова или фразы. В качестве одного из вариантов разработчики рассматривали имя Майя - но оно могло спровоцировать ошибки распознавания на фразах вроде «Девятое мая». Важно было также, чтобы имя не входило в список наиболее популярных женских имён в России - чтобы сократить количество ложных активаций. Алиса в такой список не входит, но для тех пользователей, у кого в семье есть Алиса, останется возможность активировать помощника командой «Слушай, Яндекс».

Определившись с вариантами, разработчики вместе с социологами и аналитиками «Яндекса» составили опрос для пользователей сервиса «Толока». В нём компания просила определить черты характера девушки по имени. «Пользователей нельзя спросить прямо, какое имя больше подходит ассистенту, и мы спросили хитро. Взяли нужные нам характеристики - и наоборот, совсем неподходящие, и стали спрашивать: если у девушки вот такое имя, то она скорее, например, добрая или агрессивная?».

С большим отрывом, говорит Субботин, в опросе победило имя «Алиса». «И никто за время тестирования ни разу не сказал нам, что это плохое имя».

Как «Алиса» обучалась во время тестирования

Всего в тестировании ассистента приняло участие несколько десятков тысяч человек, а продлилось оно пять месяцев.

Главное, что мы выяснили за это время, - что двигаемся в верную сторону. И что те вопросы, которые, как мы думали, должны волновать пользователей, действительно их интересуют.

Перед запуском тестирования было важно определить наиболее вероятные сценарии взаимодействия: вопросы, которые пользователи будут задавать «Алисе», - а также понять, как именно они будут их задавать.

«Мы понимали, что людей волнует, к примеру, погода. Отлично, чтобы рассказать о погоде, надо на что-то среагировать - на какие-то пользовательские фразы», - рассказывает Субботин. Определившись с темой, разработчики описали самые простые сценарии: например, когда пользователь просто спрашивает: «Какая сейчас погода?». Затем добавили более сложные варианты: прогноз погоды на конкретное число, на несколько дней, на несколько дней в следующем месяце.

Ещё одна популярная тематика - определение местоположения. Изначально команда «Алисы» собрала несколько реплик, которыми пользователи могли бы активировать сценарий, но выяснилось, что зачастую люди задают вопросы совсем не так, как могли предположить разработчики. «Мы включили: "где я", "где я нахожусь", "какое моё местоположение", "какой у меня сейчас адрес". А пользователь спрашивает: "Подскажи, пожалуйста, где моя геолокация". Такое мы не могли предусмотреть».

Разработчики отслеживают типы запросов пользователей и релевантность ответов помощника и добавляют в ассистента новые сценарии, которые не были заложены в него изначально.

Команда также занимается разработкой специальной диалоговой модели - внутри компании её называют «болталкой», - которая в будущем может взять на себя всё общение с пользователем на отвлечённые темы и обучаться новым репликам самостоятельно.

«Болталка» обучается на больших массивах текстов, в том числе диалогов. Порой, говорят создатели, они не могут предугадать ответы «Алисы» - настолько человечными они оказываются, - а иногда она может и нахамить собеседнику. Но разработчики отслеживают некорректные реплики и удаляют их из системы.

Виртуальные голосовые помощники призваны упростить наше взаимодействие с устройствами и сервисами. Вместо того чтобы блуждать по графическому интерфейсу в поисках нужного пункта меню, вы можете просто скомандовать естественным языком «Включи музыку» или «Подскажи прогноз погоды». Идеальный помощник должен правильно понять команду и выполнить её.

Технологии, которые лежат в основе таких ассистентов, пока далеки от совершенства, но уже способны впечатлять. Вы могли наблюдать их в действии, если пользовались помощниками Google Assistant, Cortana или Siri. Теперь давайте посмотрим, чем нас может порадовать « », которая недавно поселилась в приложении «Яндекс».

Синтез и распознавание речи

Хотя в голосе помощника можно без труда расслышать искусственные нотки, он звучит на порядок естественнее своего ближайшего конкурента - русскоязычной версии Siri. Для озвучивания «Алисы» привлекли актрису Татьяну Шитову. К слову, именно её голосом говорила операционная система в фильме «Она».

В плане распознавания русской речи у помощника «Яндекса» пока тоже нет равных, ошибки встречаются относительно редко. Кроме того, ассистент не просто распознаёт фразы, но и учится правильно интерпретировать их. Поэтому вы можете использовать разные формулировки и задавать последующие вопросы в контексте предыдущих - скорее всего, сервис вас поймёт:

Но промахи в интерпретации запросов пока встречаются у всех голосовых ассистентов, и «Алиса» здесь не исключение:


Интеграция со службами «Яндекса»

Другая важная особенность «Алисы», на которой делают акцент создатели, это удобная интеграция с остальными сервисами «Яндекса».

К примеру, попросите ассистента включить песню, и она заиграет в «Яндекс.Музыке». Запросите перевод фразы на другой язык - помощник откроет «Яндекс.Переводчик»:


«Алиса» также умеет отображать прогноз погоды и строить маршруты благодаря метеосервису и картам «Яндекса». А если вам понадобится найти что-либо в Сети, поможет «Яндекс.Поиск».


Взаимодействие со сторонними программами

Что касается интеграции со сторонними приложениями и службами на мобильных устройствах, то тут у «Алисы» не всё так хорошо.

Ассистент можно установить на Android и iOS, но пока «Алиса» слабо использует возможности этих платформ. Так, с её помощью вы даже не сможете быстро завести будильник, добавить напоминание или заметку. А вот Siri легко справится с этими задачами.


Хотя «Алиса» умеет открывать по запросу установленные на устройстве программы, эта функция срабатывает не всегда. Например, ассистент без проблем запускает «ВКонтакте» и Telegram, но если попросить его открыть Viber, то вместо приложения помощник направит вас на сайт этого мессенджера. На команду «открыть калькулятор» ассистент реагирует странно.


Кроме того, чтобы обратиться к «Алисе», нужно сначала войти в приложение «Яндекс» и нажать на кнопку помощника (или воспользоваться ярлыком для быстрого доступа, если у вас Android). Это не очень удобно, ведь одна из главных задач голосового ассистента - позволить вам управлять устройством без рук. Та же Siri за счёт глубокой интеграции с iOS может принимать команды, даже когда экран заблокирован.

«Алиса» на компьютере

Ассистент «Яндекса» также доступен для компьютеров под управлением Windows в виде отдельной программы. После её установки на панели задач появляется поисковая строка и кнопка для голосового взаимодействия с помощником.

Помимо функций, представленных в мобильной версии, «Алиса» для Windows умеет искать файлы на жёстком диске, запускать настольные программы, выключать компьютер или переводить его в спящий режим.

В октябре 2017 года компания Яндекс объявила о выходе нового голосового помощника Алиса. Это приложение представляет собой программу, которая способна решать повседневные задачи пользователя, такие как: оглашать прогноз погоды, открывать файлы на компьютере при помощи голосовых команд, совершать поиск информации в Интернете и многое другое. Отличительной чертой помощника Алиса является то, что она общается не при помощи шаблонных заготовок, как это делают большинство голосовых помощников, а с помощью понятной человеческой речи, формируя ответы, используя нейронные сети. Это позволяет Алисе отвечать достаточно грамотно, логично, а иногда и очень весело. После выхода помощника в массы, приложение начали тестировать и всячески выбивать из колеи привычного ведения беседы народные весельчаки. Так в Интернете появились приколы в Алиса Яндекс, о которых далее и пойдет речь.

При беседа выглядит как обычный диалог с настоящим помощником, вы задаете ей вопрос – она сразу же на него отвечает. Для этого еще можно использовать клавиатуру и мышь, если вы используете . Ответы вы можете критиковать или поощрять при помощи оценок в приложении.

Для озвучивания Алисы была приглашена Татьяна Шитова, которая озвучивает все роли Скарлетт Йоханссон в русском прокате фильмов. Голос в приложении получился очень милым и приятным. Пообщавшись с Алисой некоторое время можно заметить, что она обладает своим оригинальным характером. Например, в некоторых неправильных ее ответах на вопрос она утверждает обратное и продолжает доказывать свою правоту некоторое время.

Чувство юмора Алисы от Яндекс и приколы

При общении с помощником можно уловить ее оригинальное чувство юмора и приколы. Она имеет личные предпочтения во многих вопросах, например, ее любимые исполнители: oxxxymiron, Грибы, Дима Билан и другие. Задав ей этот вопрос: «Алиса, какая твоя самая любимая песня?», она отвечает: «Между нами тает лед, пусть теперь нас никто не найдет. Мы промокнем под дождем, и сегодня мы только вдвоем. Тыц-тыц.» Забавно, правда?

Обычно Алиса отвечает на один поставленный вопрос – одним ответом. Ее также можно попросить спеть, реакция практически во всех случаях разная. Она может даже «выделываться» как настоящий представитель женского пола. Но чаще, все же соглашается без препираний «Алиса, спой песню» — «Мы стояли на плоскости… Кажется, не ту тональность взяла. Давайте я еще сама с собой по репетирую.» Такие вот шутки она выдает довольно часто, что не может не поднимать настроение даже в плохую погоду.

Иногда наша подруга вдруг обижается на нас, если, например, мы не разрешаем Яндексу определить наше местоположение и говорит, что мы ей ничего не рассказываем. Если начать возмущаться, Алиса воспринимает это также как оскорбление и намекает на то, что мы мало воспитанные люди.

Если вам станет вдруг скучно Алису можно попросить рассказать анекдот или сказку. Она отлично с этим справляется. Когда задаешь ей вопрос о том, что она умеет, иногда она отвечает, что умеет давать житейские советы сомнительной ценности. Программисты хорошо постарались, разрабатывая приложения Алиса.

Недочеты и особенности голосового помощника Алиса

Встречаются и пробелы в работе ассистента или . Например, не всегда она способна открывать приложение, которое вы ей диктуете. На некоторые вопросы, вместо того, чтобы ответить голосом, она открывает ссылки в браузере с указанным запросом. Алиса изучает огромное количество текста в Интернете, но все же с некоторыми задачи не справляется. Нейросеть позволяет изучать как положительные тексты с приятной манерой общения, так и негативные высказывания, которые встречаются в сети. На просьбу «Закажи мне сендвич», Алиса может вам ответить – «Обойдетесь». В этом ответе можно увидеть, как прикол и юмор, так и резкий сарказм. Но даже в этом случае ее подобно ребенку можно обучить хорошей манере ведения разговора. Если вы не будете указывать ей, что она ведет беседу неправильно, то в дальнейшем от нее услышать можно и не такое.

Возможное развитие Алисы

Разработка голосового помощника Алиса началось под конец 2016 года. Индустрия движется в этом направлении, и пользователь готов общаться с компьютерным помощником нормальным человеческим языком и указывать на определенные действия при помощи диалога. С помощью приложения Алиса такой подход полностью реализуется.

На одном из выступлений, представитель Яндекс высказался: «Если у людей будет возможность говорить на нормальном языке с компьютером, почему бы это не реализовать в приложении Алиса. Если человеку нужно задать вопрос поисковику – где купить двигатель на Лада Priora седан, — то пусть у него будет возможность сделать это естественным языком, а не формулировать сначала полностью весь запрос, а уж потом задавать его поисковой системе.

Вконтакте

Почему Алиса не отвечает на некоторые вопросы?

Чтобы отвечать на ваши вопросы, Алисе необходим стабильный доступ в интернет. Проверьте ваше соединение, перезапустите приложение и спросите еще раз.

Если проблема сохраняется достаточно долго, напишите нам через форму обратной связи .

Почему Алиса активируется, когда ее не вызывали?

Алиса реагирует на свое имя, но сходно звучащие слова и фразы могут вызвать ложное срабатывание.

Откуда Алиса знает, где я живу?

Алиса старается использовать все доступные ей данные. Например, вы задали домашний адрес в Яндекс.Навигаторе - теперь этот адрес привязан к вашему аккаунту в Яндексе. Если вы авторизуетесь в приложении, в котором разговариваете с Алисой, она получит доступ к адресу и даже сможет поменять его по вашему запросу.

Если вы уверены, что Алиса не должна чего-то знать, напишите нам через форму обратной связи .

Почему Алиса показывает ребенку контент для взрослых?

Результаты поиска, которые показывает Алиса, зависят от настроек вашего аккаунта.

Чтобы отфильтровать контент для взрослых:

  1. Настройте семейный поиск .
  2. Авторизуйтесь в каждом приложении, в котором вы общаетесь с Алисой.


© 2024 beasthackerz.ru - Браузеры. Аудио. Жесткий диск. Программы. Локальная сеть. Windows