Мобильные ассистенты: настоящее и будущее

Мобильные ассистенты: настоящее и будущее

Опубликовано в номере:
PDF версия
В последнее время все большую популярность набирают приложения, призванные облегчить повседневную жизнь пользователей смартфонов и планшетов. Если первые прототипы виртуальных ассистентов создавались для армии США, то сейчас они доступны широким массам. Свое применение мобильные ассистенты также находят в B2B-сегменте. Их использование не только позволяет компаниям экономить значительные ресурсы, но также способно стать конкурентным преимуществом в глазах клиентов.

Мобильные ассистенты в своем большинстве способны обрабатывать голосовой запрос пользователя и выдавать на него релевантный ответ. Конечно, голосовым управлением различных девайсов сейчас сложно удивить. Роботы, способные выполнять команды по кодовым словам; телевизоры с функцией реакции на голос; дверные замки, узнающие хозяина по его речи… Таких примеров множество. Гораздо сложнее дело обстоит с распознаванием разговорной речи и выделением основной идеи из контекста. Эта проблема особенно остро затрагивает русскоговорящих пользователей. Самый известный сервис из ряда электронных ассистентов — Siri — до сих пор не поддерживает русский язык, хотя первые шаги для этого сделаны с появлением iOS 7 beta.

Итак, перечислим, что должен уметь в нашем представлении современный мобильный ассистент:

  • Распознавать речь. Сюда относятся понимание речи пользователя, идентификация по голосу и другие функциональные особенности.
  • Распознавать смысл сказанного. Для этого необходим гибридный анализ, включающий в себя как лексический, так и семантический анализ полученной фразы; выделение основных ключевых слов и определение потребности пользователя из запроса.
  • Выполнять функциональные задачи, то есть уметь предоставлять релевантную информацию на запрос пользователя.
  • Синтезировать речь, то есть озвучивать ответы пользователю человеческим голосом.
  • Работать с контекстом. К этой работе относится обработка неточных или неполных запросов пользователя. Недостающие данные ассистент должен брать из предыдущих бесед, среди уникальных данных о своем хозяине или из внешних источников данных.

Весь этот функционал должен быть представлен в интуитивно понятной пользователю и простой в обращении оболочке.

 

Откуда что пошло

Для лучшего понимания роли мобильных ассистентов в современном мире предпримем небольшой экскурс в историю. В 2005 г. исследовательский институт SRI International дал старт проекту CALO, результатом которого должен был стать первый виртуальный цифровой помощник. Затраты на проект оцениваются в $150 млн за четыре года работы. Исследователи из ведущих вузов и подразделений коммерческих компаний США выдвигали идеи и представляли прототипы сервисов, способных учиться и понимать задачи, подстраиваться под привычки и предпочтения конкретного человека, планировать за него расписание, систематизировать информацию, расставлять приоритеты при сборе данных, самостоятельно искать новые источники информации. В итоге был получен виртуальный цифровой помощник для армии США, умеющий разбирать почту, составлять отчеты по содержанию электронных писем и формировать графики встреч и заседаний.

Реальным результатом программы стало появление коммерческой разработки — упомянутой выше Siri, созданной участниками проекта CALO.

На рынке особо выделяются решения российских специалистов. Российская инновационная компания i-Free Innovations (Санкт-Петербург) одной из первых в мире начала работу в сфере распознавания и обработки голосовых запросов пользователей. Результатом явилась серия приложений, раскрывающая возможности мобильных ассистентов с разных сторон.

Мобильные ассистенты Everfriends  («Друзья навсегда»)

Рис. 1. Мобильные ассистенты Everfriends («Друзья навсегда»)

Первым шагом на этом пути стало появление на российском рынке мобильного ассистента «Карманная блондинка» (Brainy) с 3D-персонажем и системой диалогов. Это приложение, выпущенное i-Free Innovations, пользовалось большим успехом не только в России, но и за рубежом. Впоследствии появилась линейка приложений Everfriends («Друзья навсегда», рис. 1), в которой органично сочетаются утилитарно-полезные функции, развлечения и система интеллектуального управления. Такие ассистенты могут поддерживать полноценный голосовой диалог с пользователем и разговаривать с ним на самые разные темы. Приложение Everfriends имеет расширенные возможности. Помимо стандартных рабочих функций, таких как звонки, отправка SMS, уведомления о событиях, будильник, заметки, новости, новостные ленты Facebook и Twitter, радио, игры, гороскопы, анекдоты и т. п., в нем реализована интеграция с Google Maps и Wikipedia, а также с приложением, обеспечивающим онлайновый просмотр на смартфоне телевизионных программ. Отличительной особенностью Everfriends являются реалистичные 3D-персонажи, любого из которых можно назначить своим ассистентом. Каждый персонаж обладает яркой индивидуальностью, своим характером и чувством юмора, что делает приложение максимально приближенным к живому помощнику. Все персонажи имеют собственный голос, что отличает их от других продуктов с голосовым управлением, где пользователь слышит обычно обезличенную механическую речь.

Другим важным шагом в направлении развития российских мобильных помощников стало создание Siri style-приложения с простым, не перегруженным лишними деталями интерфейсом и богатейшим функционалом — «Ассистент на русском» (рис. 2). В первый же месяц после выхода приложения его установили на свои смартфоны более 100 тыс. русскоязычных пользователей Android. Это приложение эффективно распознает голосовые запросы на естественном русском языке и, что особенно важно, быстро и точно выдает пользователю релевантные ответы. Например, на голосовой запрос «Где я могу заправить машину?» виртуальный ассистент найдет все заправки рядом и покажет их на карте. А в ответ на фразу «Буди меня по рабочим дням в 7 утра» приложение создаст будильник на будние дни в обозначенное время.

Помимо распознавания естественной русской речи, виртуальный ассистент владеет также навыком «нечеткого поиска», технологичность которого можно оценить в сервисах «Звонки» и «Запуск приложений». К примеру, если пользователь скажет: «Запусти Ангрибердз», не заботясь о четком произношении англоязычного названия, приложение откроет игру Angry Birds, установленную на телефоне. Уже сейчас в приложении «Ассистент на русском» реализовано более 15 сервисов для голосового поиска, голосовых команд и голосовой справки, которые помогут не забыть о важных делах и быстро получить ответы на самые разные вопросы. «Ассистента» можно, например, попросить «Напомни мне погулять с собакой в девять вечера», «Напомни позвонить родителям» и т. п. Можно также спросить: «Где пообедать?», «Будет ли завтра снег?», «Как пройти в библиотеку?» и получить ответы на все эти вопросы.

 «Ассистент на русском»

Рис. 2. «Ассистент на русском»

Высокую точность и скорость работы «Ассистента на русском» обеспечивает собственная технология распознавания смысла, рассчитанная на восприятие команд и поисковых запросов, привычных и понятных русскоязычным пользователям.

 

Будущее толкает нас в спину

Мобильный ассистент «Собеседница»

Рис. 3. Мобильный ассистент «Собеседница»

Совсем недавно (в конце июля) на рынке появилась «Собеседница» (рис. 3) — приложение, сочетающее в себе все плюсы предыдущих продуктов. Одним из преимуществ i-Free на рынке является собственная AI-технология, способная решать сразу две задачи — обрабатывать запрос пользователя на разговорном языке и выполнять функции чат-бота, облегчающие общение с пользователем. Летом 2012 г. эта технология победила в одном из самых престижных конкурсов систем искусственного интеллекта Turing 100 AI Machines Competition — самом крупном состязании в мировой AI-индустрии.

 

Кроме продуктов, предлагаемых компанией i-Free, на российском рынке выделяется «Ассистент» от компании Speaktoit. Это приложение в должной степени отвечает всем требованиям к мобильному помощнику, перечисленным выше, и работает на нескольких языках. Остальные же приложения в данном сегменте на сегодня представляют собой только первые попытки инди-разработчиков создать виртуального ассистента и находятся в стадии альфа- или бета-тестирований, поэтому говорить об их функционале и конкурентных преимуществах пока рано.

Если рассматривать рынок мобильных ассистентов в целом, то на первом месте уверенно находятся ассистенты на английском языке. Преимущество англоговорящего сегмента обусловлено международным статусом языка. Среди iOS-пользователей вне конкуренции уже упомянутая Siri. Причем, несмотря на то, что русский язык она не поддерживает, среди русскоговорящих пользователей Siri достаточно популярна (видимо, из-за отсутствия достойных альтернатив). Что касается платформы Android, наибольшим количеством закачек может похвастаться ассистент Vlingo Virtual Assistant — более 8 млн установок. Но конкуренция на этой платформе достаточно сильна. Прочными позициями обладают Skyvi и iris. На двоих у них около 6 млн загрузок в Google play.

Важно отметить, что мобильные ассистенты подходят для использования как в B2C-приложениях, так и в B2B-проектах для сторонних партнеров.

Именно работа в B2B-сегменте особенно важна, ведь интерес к данному сектору рынка растет быстрыми темпами, о чем свидетельствует прошедшая в мае этого года в Санкт-Петербурге международная конференция AINL 2013, посвященная вопросам искусственного интеллекта и естественного языка. В рамках конференции было объявлено об образовании более чем десятка новых стартапов в этой области, каждый из которых открывает новые горизонты применения искусственного интеллекта.

 

От экспериментов к практике: «диспетчер» и «домовой»

На Западе крупные компании уже внедряют продукты, основанные на технологиях распознавания и обработки запросов на разговорном языке. Это позволяет им экономить ресурсы и характеризует их как новаторов. В России крупные игроки сегодня внимательно и осторожно присматриваются к новинкам, но нет сомнения, что в скором времени опыт иностранных коллег будет заимствован. Рассмотрим несколько примеров из разных сфер.

В банковском деле голосовое управление способно кардинально снизить расходы на услуги Call-центров. Клиент банка, позвонив в службу поддержки, получает консультации не от живого человека, а от AI-робота, способного распознавать разговорную речь и выделять из контекста именно то, что в данный момент интересует клиента, выдавая в ответ релевантную информацию.

То же самое касается и мобильных операторов. С помощью виртуального ассистента клиент может узнать всю необходимую информацию об услугах компании, новых тарифах, акциях и т. д. Если абонент отправляется в другую страну, электронный помощник от оператора сможет проконсультировать его по всем связанным с путешествием вопросам. Именно удобство коммуникации с пользователем и предоставление ему нужной информации привлекательны для операторов.

Еще одно важное место, где использование виртуальных ассистентов может значительно облегчить жизнь, — собственная квартира. Возможно, в ближайшее время мы сможем управлять любым устройством только с помощью голоса, а также вести беседу с собственным «виртуальным домовым», который знает все о своем хозяине и помогает ему в важных операциях. После фразы «выключи свет» освещение в доме будет приглушаться до предпочитаемых жильцом характеристик. Запрос «я в отпуске в ближайшие две недели» может означать совокупное управление несколькими системами в доме, после чего они переходят в режим экономии. «Повысь температуру на 2 градуса», «включи мою любимую музыку», «разбуди меня в 7 утра» — виртуальный домовой сможет выполнять фактически любую команду пользователя. Кейс не так фантастичен, как кажется.

 

Роботы нам в помощь

И, наконец, робототехника. Голосовое управление вскоре должно стать неотъемлемой частью практически любого робота. Решение по анализу естественного языка запросов может быть использовано для создания простейших управляющих конструкций в архитектуре контроля за жизнеобеспечением такого устройства. К примеру, когда пользователь произносит: «Подними ногу», «Поверни голову» и т. п. Роботы-помощники, готовые по требованию хозяина выполнять команды, станут привычны в самом ближайшем будущем. Уже сейчас есть несколько видов роботов, которые помогают человеку в хозяйстве: роботы-пылесосы, роботы — чистильщики бассейнов и т. д. Так, роботы-пылесосы третьего поколения Roomba от компании iRobot не нуждаются в указании размеров площади, сами находят зарядное устройство, производят уборку и по необходимости управляются дистанционно. Следующий неотвратимый шаг — управление с помощью голоса.

Кроме этого, подобное технологическое решение может быть использовано для построения персональных коммуникаций, продвижения в диалоге разнообразных услуг и брендов, ведь роботы являются по-настоящему уникальными рекламными площадками. Людям априори с ними интересно общаться, вести диалоги на произвольные темы. В отличие от ассистентов в мобильном телефоне, здесь ощущается «эффект присутствия», и живое общение производит неизгладимое впечатление.

* * *

Технологии развиваются стремительно, каждый новый день готовит нам сюрпризы, предлагая новые, казавшиеся раньше фантастическими, технические решения. Такие решения способны изменить привычную жизнь, сделать ее комфортней, интереснее, насыщенней. И у мобильных ассистентов в этом плане отличное будущее. Широта возможностей их применения поистине огромна… Теперь слово за компаниями, которые готовы стать первопроходцами и превратить мобильное приложение из личного ассистента пользователя в свое конкурентное преимущество.

Данная статья основана на докладе авторов, прозвучавшем на конференции AINL в Санкт-Петербурге 18 мая 2013 г.

Литература
  1. http://www.ai.sri.com/project/CALO

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *