«Т-Технологии» выпустили ИИ T-one для распознавания речи — и обошла конкурентов

Применима для голосовых ассистентов, кол-центров и экономична для бизнеса
Ольга Колина Автор статьи

Компания «Т-Технологии», владелец «Т-Банка», анонсировала разработку новой модели искусственного интеллекта для распознавания речи с открытым исходным кодом, получившей название T-one. Данная модель, по утверждению разработчиков, демонстрирует улучшенные показатели в области распознавания речи.

Представители «Т-Технологий» в интервью изданию Forbes подчеркнули, что T-one может служить основой для создания инновационных решений в сфере автоматического распознавания речи. В частности, модель обладает потенциалом для применения в системах реального времени.

T-one представляет собой высокопроизводительную систему автоматического распознавания речи (ASR), ориентированную на русский язык и предназначенную для использования в телефонии. Доступ к модели предоставляется через официальный сайт компании на платформе GitHub, а также через платформу Hugging Face.

T-one характеризуется относительно компактной архитектурой, включающей около 70 миллионов параметров. Для сравнения, модель GigaAM от «Сбера» содержит 240 миллионов параметров, а Whisper large-v3 от OpenAI — 1,55 миллиарда параметров. Несмотря на меньший объем, разработчики T-one утверждают, что их модель демонстрирует превосходство в области распознавания русской речи в телефонных переговорах, для чего она и была специально разработана.

Модель T-one может представлять интерес как для коммерческих организаций, так и для научного сообщества. Для научного сообщества она привлекательна своей экономической эффективностью. Использование модели на собственных серверах может быть значительно более экономически выгодным по сравнению с конкурирующими решениями от облачных провайдеров. Кроме того, T-one обладает потенциалом для адаптации под специфические потребности компаний и разработки уникальных решений.

Представители «Т-Технологий» на конференции Turbo ML уточнили, что модель может быть востребована компаниями, занимающимися разработкой голосовых роботов и ассистентов, а также автоматизацией кол-центров. Использование T-one в качестве основы для новых решений позволяет существенно сократить затраты на разработку с нуля, сообщает Forbes.