«Яндекс» объявил о переходе на использование в мобильных приложениях технологии распознавания голоса собственной разработки под названием Yandex SpeechKit. До этого поисковик использовал для этих целей платформу, созданную компанией Nuance.
Yandex SpeechKit работает в операционных системах iOS и Android, поддерживает, по словам создателей, две темы запросов: «общую» (все, что ищут в интернете) и «гео», связанную с поиском адресов, названий организаций и т.п.
Голосовой ввод сейчас доступен только на русском языке, и произнеся поисковый запрос, например, «лазерный пилинг лица отзывы» вы попадете на выдачу о пилинге лица. На данный момент образом украинская и турецкая версии поисковика по-прежнему продолжают использовать движок Nuance.
Библиотеки Yandex SpeechKit как для Android, так и для iOS разработчикам предоставляются бесплатно, однако число бесплатных запросов к движку распознавания голоса ограничено 10 тыс. запросов в день. Стоимость обращения при превышении этого числа не установлена, сообщили CNews в «Яндексе».
Публикация Yandex SpeechKit именно для мобильных платформ, по словам руководителя проекта Дениса Филиппова была обусловлена тем, что «голосовые технологии наиболее актуальны там, где есть сложности с текстовым вводом, а это прежде всего мобильные устройства». Но, говорит Филиппов, он думает над тем, чтобы сделать фреймворк и для десктопных приложений.
По результатам внутренних исследований поисковика, Yandex SpeechKit способен верно распознавать 84% слов в общепоисковой категории и запросов, 94% слов – по геозапросам. Средняя скорость распознавания составляет 1,1 секунды.
При создании Yandex SpeechKit было использовано около 300 часов мужской, женской и детской речи для обучения акустических моделей и «сотни миллионов специально подготовленных текстов» для обучения языковой модели.
Стоит заметить, что API распознавания речи для мобильных устройств (но исключительно под управлением Android) предоставляется Google (API android.speech). В его описании ограничение на количество бесплатных обращений не встречается.