Компания Xiaomi представила три новые языковые модели искусственного интеллекта: MiMo-V2-Pro, MiMo-V2-Omni и MiMo-V2-TTS. Разработанные технологии интегрируются в приложения и сервисы компании, расширяя функциональные возможности её продуктов.
Модель MiMo-V2-Pro является ключевым элементом стратегии компании в области искусственного интеллекта. Она предназначена для выполнения сложных многоступенчатых задач с минимальным участием человека. MiMo-V2-Pro обладает значительным объёмом параметров, превышающим 1 терабайт, и контекстным окном в 1 мегабайт. Xiaomi заявляет, что по качеству MiMo-V2-Pro сопоставима с ведущими мировыми аналогами, при этом предлагая более конкурентоспособное ценовое предложение.
MiMo-V2-Omni отличается мультимодальными возможностями, обрабатывая не только текстовые данные, но и изображения, аудио и видео. Модель способна анализировать длинные записи разговоров и понимать содержание видео одновременно, что расширяет её функциональность в различных сценариях использования.
MiMo-V2-TTS специализируется на генерации речи. Она позволяет настраивать голос, изменять его тон, эмоциональную окраску и стиль. Модель поддерживает несколько диалектов китайского языка и способна не только генерировать речь, но и имитировать пение.
Все три модели уже доступны для разработчиков, что позволяет им интегрировать их в свои продукты и сервисы.