Alibaba создали нейросеть, способную распознать голос человека в толпе.
Глава отделения науки о данных Alibaba Ронг Джин рассказал о нейросети, способной распознать голос человека в шумных местах. Специалисты Alibaba утверждают, что точность достигает 94−95 %, несмотря на сильный акцент оратора. В шанхайском метро на основе этой нейросети введена система оплаты проезда.
Нейросеть, способная распознать голос
Компания решала проблему с использованием как аппаратной, так и программной составляющей. В этом им помогли система удалённых направленных микрофонов и алгоритм нейросети, отрезающий лишние голоса.
Alibaba использует ИИ для обработки естественного языка в реальном времени с помощью облачного сервиса. Кроме того, он отвечает за приём тысяч звонков от клиентов в сервисе Alime. Благодаря машинному обучению, ИИ отвечает на вопросы клиентов без вмешательства людей. В случае обращения клиента в чат бот умеет вырезать фрагменты текста и предоставлять изображения. По словам специалистов компании, он делает это быстрее человека.
Посмотрим что будет дальше!