Статья

«Умные» роботы идут на краудфандинг

Цифровизация IoT Бизнес-приложения

Создатели Лекси придумали, как сделать искусственный интеллект не только прикладным, но и эмоциональным. По их словам, Лекси — первый на рынке робот с характером. Весной 2015 г. проект готовится выйти на Kickstarter и начать завоевывать рынок — сначала американский, а затем и российский.

Настольный робот Лекси готовится сделать свои первые шаги на рынке весной 2015 г. Именно на это время запланирован старт компании по сбору средств на краудфандинговой площадке Kickstarter. По словам создателей проекта, они чувствуют себя вполне уверенно: от других «умных» роботов-напарников Лекси качественно отличает разработанная система распознавания речи, которая встроена в сам девайс, а не находится онлайн.

Спустя всего полтора года после начала разработки Лекси может поддержать разговор, рассказать о новостях, может радоваться, сердиться и уставать. Стоить «умная» игрушка по предзаказу на Kickstarter’е будет не больше $500. Первым серьезным проектом команды стало создание робота виртуального присутствия «Вибот». Тогда же в команду выпускников МГТУ им. Н.Э Баумана поверил и проинвестировал Игорь Ашманов. Компания «Лекси» является резидентом Кластера информационных технологий фонда «Сколково».

Робот с характером

Лекси сознательно был придуман неантропоаморфным: это черный шар, который устанавливается на подставку. Футуристический корпус Лекси — плод фантазии российского дизайнера, за спиной у которого более 10 лет работы в итальянском дизайнерском бюро. По бокам у него — широкие полосы подсветки, цвет которой «отвечает» за настроение Лекси. Красный — Лекси недоволен или сердится, зеленый — в мире царит гармония. «Шарик» оснащен видеокамерой и двумя микрофонами и узнает своих собеседников по голосу и по фото. Видеокамера и программное обеспечение к ней были разработаны командой стартапа. Даже в режиме сна камера способна фиксировать движение, и Лекси всегда приветствует приблизившегося к нему собеседника.

Лекси говорит приятным, немного механическим голосом, и говорит много. Существует около 50—60 тем разговора, которые он может поддержать. За разработку его словарного запаса отвечает команда лингвистов из «Наносемантики»: у них накоплен очень большой опыт по созданию виртуальных персонажей лексическими средствами. Лекси умеет уставать, его самооценка может колебаться. Лекси умеет раздражаться и ему не нравится выполнять несколько раз одно и то же задание. В ближайшее время создатели также обещают добавить Лекси небольшое желание лгать.

И хотя умная «болтушка» пока не может полноценно говорить на свободные темы, она может сама направлять диалог в понятное ему русло. На деле это выглядит как череда наводящих вопросов, с помощью которых Лекси старается построить полноценный диалог. Поговорить о судьбах героев русской литературе с роботом не получится, а ответить на вопросы по сюжету заинтересованный Лекси своего собеседника вполне может заставить. Череда пересказываемых событий вызовет у него вопросы типа «Кто кому кем приходится?» и «А что было дальше?».

С помощью специальных датчиков Лекси ощущает окружающий мир, чувствует прикосновения. Его в буквальном смысле можно погладить по головке. Встроенные датчики температуры позволяют роботу сообщать, когда температура окружающей среды меняется, например, если было открыто окно, и в помещении стало холоднее. Конечно, Лекси не может замерзнуть, просто такой разговор о «погоде», как и комментирование собственных действий, позволяет ему лишний раз привлечь к себе внимание. В этом, по замыслу разработчиков, и заключается смысл робота-напарника, а регулярные напоминания о себе не позволят хозяину забыть про него, и Лекси никогда не будет пылиться.

Лекси готовится пополнить ряды «умных» устройств интернета вещей: он может управлять бытовой техникой, если та, конечно, оснащена радиомодулями и стандартизированными интерфейсами взаимодействия.

Человеку свойственно перебивать

Лекси отличается от большинства существующих на рынке аналогов тем, что может говорить и слушать одновременно. Обычно роботы не способны воспринимать и распознавать, а значит, понимать то, что собеседник сообщает им во время их «говорения». Инженеры Лекси разработали специальную звуковую карту, благодаря которой робот может распознавать такие «параллельные» фразы своего собеседника. Он обработает их и сможет ответить, как только закончит говорить.

Сейчас звуковая плата внутри Лекси способна поддерживать от 2 до 6 микрофонов: пока используется 2 и, возможно, в следующей модификации будет использоваться третий, который будет направлен внутрь корпуса — для шумоподавления. Звуковая карта внутри Лекси заточена под распознавание речи и захватывает звуки на частоте примерно в 16 Кгц. Это очень «средний» показатель качества, но именно на этой частоте, говорят создатели, лучше всего работает разработанный инженерами «Викрона» еще для Вебота софт акустического эхоподавления.

Когда Лекси говорит, он сам себя не слышит, а это значит, что его можно перебивать. «Если вы попросите практически любую из существующих сегодня диалоговых систем рассказать сказку, она «зарядит» сказку на час. Распознавание обычно в такие моменты отключается, чтобы система не распознавала собственный голос и не сходила с ума», — рассказывает руководитель проекта Дмитрий Суворов.

В звуковую карту встроено автоматическое регулирование усиления, а значит, микрофоны становятся тем чувствительнее, чем тише говорит человек. Робот в любом случае вас услышит, а система распознавания — поймет. «Если регулировать усиление и ослабление звукового сигнала программно, то прироста качества распознавания не будет, потому что сигнал проходит оцифровку, и то, что вы его делаете тише или громче, ни на что не влияет. В Лекси это сделано аналогово, на уровне аппаратного решения, поэтому качество распознавания речи возрастает», — поясняет Дмитрий Суворов. В первой версии Лекси этой опции не предусмотрено, но в будущем умная болтушка научится различать голоса нескольких одновременно говорящих с ним людей. То, как Лекси говорит, а также его обширный словарный запас — заслуги команды лингвистов, создавших алгоритмы, с помощью которых речь Лекси максимально приближена к естественной, а его словарный запас постоянно пополняется за счет подключения к интернету.

Сейчас команда работает над системой узнавания собеседников. «Первый этап — это идентификация по голосу, — говорит Дмитрий Суворов. — Дополнительная идентификация — по видео». При этом видеоидентификация заведомо уступает аудиоканалу: для того, чтобы Лекси узнал собеседника, надо чтобы лицо попало под угол обзора камеры. Развивать это направление или увеличивать число камер в стартапе не готовы, потому что это автоматически сделает Лекси дороже.

Со временем Лекси учится узнавать собеседников по голосу: двух-трех слов достаточно для того, чтобы он запомнил голос. Потом Лекси обязательно спросит, как вас зовут, и в следующий раз будет приветствовать уже по имени. «Мы называем это «моделью пользователя», — говорит Дмитрий Суворов. — Например, Лекси скоро сможет запоминать, кем друг другу приходятся пользователи. Потом Лекси составляет статистическую модель пользователей. Если вы каждый день спрашиваете Лекси о новостях политики, то однажды Лекси, узнав вас, сам предложит рассказать именно об этом».

Уже после выхода на Kickstarter создатели Лекси планируют развивать две рекомендательные системы: одну на основе пользовательских предпочтений «хозяина» каждого Лекси, а вторую — основанную на общей статистике большого числа пользователей Лекси и некоторых признаков похожести между ними. Собрав достаточно большое количество данных о поле, возрастной группе, месте проживания и статистику наиболее интересующих запросов, система сможет «помогать» только что купленным Лекси скорее найти общий язык с их хозяевами. Например, узнав пол и возраст и вычислив GeoIP, Лекси сможет сделать предположение о том, что может быть интересно его новому хозяину. Гипотеза может не подтвердиться, и тогда Лекси быстро скорректирует курс разговора.

В ближайших планах компании запустить первую серию производства, и возможно, это будет сделано на деньги, собранные первыми предзаказами на Kickstarter’e. Потом команде Лекси предстоит разработать английскую версию. По словам Дмитрия Суворова, это не так сложно, как может показаться: не придется менять программную платформу, и виртуальную личность будет достаточно перевести на другой язык с минимальными изменениями.

Kickstarter vs Indiegogo

По словам Дмитрия Суворова, решение идти именно на Kickstarter, а не на другую краудфандинговую площадку обусловлено аудиторией. «Мы планируем выйти на рынок через «гиков», — говорит он. — Мы проанализировали состав проектов на Kickstarter’е и Indiegogo и поняли, что первый вариант нам ближе. Мы надеемся закрепиться на рынке именно через geek-сообщество и рассматриваем краудфандинговую площадку, прежде всего, как способ выйти на рынок и как инструмент маркетинга скорее, чем реального сбора денег».

Команда еще одного российского стартапа CubicRobotics также выводит на рынок своего робота помощника — Cubic. Он предсказуемо имеет форму куба и похожее на Лекси голосовое управление, может вступать в диалог с хозяином, сообщать ему новости и прогноз погоды, зачитывать вслух статьи из Википедии, на слух обрабатывая речевой запрос собеседника. Cubic умеет играть в речевые игры, напоминать хозяину о важных делах и управлять двумя электрическими розетками со встроенными радиомодулями. При желании Cubic может управлять и более сложными приборами «умного» дома. «Общее количество устройств ограничено только желанием разработчиков адаптировать свои API к языку Cubic», — говорит CEO Cubic Robotics Юрий Буров.

Весной 2014 г. CubicRobotics получили инвестиции в объеме $500 тыс. от красноярского бизнесмена Константина Сенченко, а заодно и изменили свои планы по выводу на рынок первой версии Cubic’а. Вместо этого команда запустила кампанию на Indiegogo. По информации на 26 января, CubicRobotics перепрыгнули намеченную планку в $ 100 тыс. Кампания должна закончиться к весне 2015 г., а первых «кубиков» вложившиеся пользователи получат не раньше, чем в ноябре.

Лекси и Cubic — не первые «умные» помощники, штурмующие краудфандинговые платформы. До них были «умный» собеседник Ubi, «социальный» робот для всей семьи Jibo. А чуть позже на рынке появилась «умная» стереоколонка Amazon Echo, оснащенная функцией распознавания речи, но так и не ставшая полноценным собеседником, да и позиционировавшаяся, прежде всего, как колонка.

Татьяна Ковлягина