Microsoft анонсировал конкурента Siri с голосовым управлением в VR

Microsoft представили службу пользовательской речи (Custom Speech Service), последнюю программу, которая пополнила ряды когнитивных служб Microsoft. Это набор инноваций, направленных на решение возникающих проблем искусственного интеллекта, как компьютерное зрение и машинное обучение. Служба пользовательской речи является легко приспосабливающейся программой преобразования голоса в текст, которая позиционируется как гораздо более умная версии Siri или Google Assistant.

Служба пользовательской речи сочетает в себе две передовые технологии нового поколения. Первая известна как CRIS или Custom Recognition Intelligent Service. По словам Microsoft, CRIS:

… Предоставляет компаниям возможность применять настраиваемое распознавание речи. Разработчик может загружать образцы аудио файлов и транскрипций, и распознаватель будет настраивается с учетом конкретных обстоятельств. Распознавание будет работать даже в необычных условиях , например в заводском цеху или на улице.

По сути, это означает, что CRIS позволит определенным организациям, настроить свой собственный уникальный лексикон голосовых команд, чтобы специализированные voice-to-text команды работали лучше. Так что в больнице, например, можно было бы создать для пациентов комплексный список процедур или недугов, чтобы они могли узнать о них больше.

Чтобы сделать Custom Speech Service настолько мощной насколько это возможно на помощь Крису приходит LUIS (Language Understanding Intelligent Service). Microsoft описывают ЛУИС как «движок намерений» и с его помощью компьютеры смогут понять смысл наших слов. Например, в голосовых программах, которые есть у нас сейчас, конкретное слово или фраза ведут к какому-либо действию. Фразы «найти кофе» или «кофе поблизости» обе вызовут приложения с картами и направят вас к ближайшему кафе. С LUIS можно просто сказать, «найти кофе, отведи меня в кофейню, мне нужен кофе, мне нужно немного взбодриться, у меня глаза слипаются, и т.д.». LUIS понимает, что конкретно мы имеем в виду — не только наши слова. С её помощью гораздо больше голосовых команд станут полезней для потребителей с гораздо меньшими усилиями со стороны программистов.

Starship Commander — VR управляемый голосом

Служба пользовательской речи это именно служба. Самому Microsoft не обязательно создавать продукт вокруг программы. Эта работа ложится на клиентов, таких как Human Interact — студия виртуального реальности.

Дебютный проект Human Interact — это VR игра, управляемая голосом, которая в полной мере использует новые мощные инструменты Microsoft. UploadVR были одними из первых, кто попробовал Starship Commander, и то, что мы обнаружили, было самым сложным движком голосового взаимодействия из всех, что мы видели в VR.

Starship Commander это больше интерактивный фильм, чем игры, и вся суть заключается в голосе. Вы играете в качестве пилота межзвездного космического корабля, которого в его миссии сопровождают суперкомпьютер и голография вышестоящего начальника. Вы взаимодействуете с обоими героями через голосовые команды с огромным количеством разветвленных вариантов для изучения. В моей короткой демке я испробовал, может быть, 20 строк диалога, но разработчики объяснили, что я только слегонца соприкоснулся с теми сотнями диалогов, что они запрограммировали.

Starship Commander была создана с использованием CRIS и LUIS и, как следствие, персонажи в игре были в состоянии понимать и отвечать на вопросы, завязанные на уникальном словарном запасе о космических кораблях и инопланетянах. Благодаря Луису они также были в состоянии правильно понимать, что я хочу сделать, даже если мои фразы не были сопоставлены с конкретным результатом. Говоря «давайте двигаться дальше» я продвигался вперед. Несмотря на то, что конкретно эта комбинация слов не была привязан к конкретной команде, игра с легкостью поняла мое намерение благодаря пакету новых трюков от Microsoft.

Вместе с Custom Speech Service и со всеми программами когнитивных служб (8 доступны сейчас, 17 в режиме предварительного просмотра для разработчиков), Microsoft взяли на себя миссию «сделать искусственный интеллект доступным для каждой организации и каждого человека.»

Понравилась статья? Поделиться с друзьями:
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: