На Камчатке хотят создать корпус корякского языка с помощью ИИ

20.03.2026, 16:16 , Евгений Жегулов

Камчатский государственный университет имени Витуса Беринга совместно с Школой лингвистики Национального исследовательского университета «Высшая школа экономики» (НИУ ВШЭ) инициировал проект по созданию параллельного корпуса корякского языка с применением технологий искусственного интеллекта.

Корякский язык, находящийся под угрозой исчезновения, характеризуется ограниченным числом носителей, преимущественно проживающих в удаленных сельских поселениях, и утратой позиций среди молодого поколения в пользу русского языка.

Языковой корпус представляет собой цифровую базу данных, содержащую текстовые материалы, классифицированные по грамматическим и семантическим признакам. Эти данные используются для обучения переводческих систем и голосовых ассистентов. Учитывая ограниченное количество доступных текстов на корякском языке, стандартные методы обучения нейронных сетей не применимы. Исследователи планируют использовать модель, адаптированную для работы с небольшими объемами данных, в сочетании с ручным аннотированием.

Основу проекта составляют полевые исследования, проводимые в северных районах полуострова, с целью фиксации живых речевых образцов носителей языка. В рамках проекта уже разработаны и внедрены следующие продукты: мобильное приложение Koryak tuyu для изучения языка, онлайн-словарь, прогнозы погоды на корякском языке и книга комиксов. Дополнительно проводятся аппаратные исследования артикуляторных характеристик корякского языка, пишет ТАСС.