Бесплатное приложение на основе искусственного интеллекта преобразует речь в печатный текст

07.03.2018 23:26  2737   Анна Заморникова  Новость

В будущем авторы проекта намерены продолжить совершенствование алгоритмов приложения.

Бесплатное приложение на основе искусственного интеллекта преобразует речь в печатный текст

На Mobile World Congress 2018 был представлен новый бесплатный сервис Otter, запущенный стартапом AISense и способный трансформировать устную речь в текст. Приложение создано на основе технологии Ambient Voice Intelligence и пригодится для тех, кто посещает лекции, берет интервью, а также будет очень кстати для создания личных заметок.

Существует множество бесплатных приложений подобного рода, но не все из них способны превращать речь в печатный текст без погрешностей. Те, которые предлагают качественную работу, недешевы. Например, сервис Amazon Transcribe берется за обработку 200-минутной записи за 4,80 долларов. Otter как раз отличается от своих аналогов наличием интеллекта, умеющего конвертировать устную речь в текст в реальном времени. Новейшие алгоритмы, включенные в приложение, позволяют весьма точно синтезировать речь.

Технология создания текста проста. Сначала пользователь «наговаривает» материал в режиме записи, приложение запоминает его в первичном варианте, а потом уже искусственный интеллект берется за обработку и отшлифовывает текст до окончательного варианта. Интересная особенность ждет создателей интервью. Приложение может идентифицировать голоса, скажем, двух собеседников и разделять их. Для этого нужно до начала беседы сказать в микрофон пару фраз для запоминания голосов системой. Неточности и ошибки есть пока и у Otter. Связаны они в основном с расстановкой знаков препинания и нестабильностью работы в местах с повышенным уровнем шума, но разработчики попытаются устранить эти недостатки.