На Камчатке хотят создать корпус корякского языка с помощью ИИ

фото: freepik
Камчатский государственный университет имени Витуса Беринга совместно с Школой лингвистики Национального исследовательского университета «Высшая школа экономики» (НИУ ВШЭ) инициировал проект по созданию параллельного корпуса корякского языка с применением технологий искусственного интеллекта.
Корякский язык, находящийся под угрозой исчезновения, характеризуется ограниченным числом носителей, преимущественно проживающих в удаленных сельских поселениях, и утратой позиций среди молодого поколения в пользу русского языка.
Языковой корпус представляет собой цифровую базу данных, содержащую текстовые материалы, классифицированные по грамматическим и семантическим признакам. Эти данные используются для обучения переводческих систем и голосовых ассистентов. Учитывая ограниченное количество доступных текстов на корякском языке, стандартные методы обучения нейронных сетей не применимы. Исследователи планируют использовать модель, адаптированную для работы с небольшими объемами данных, в сочетании с ручным аннотированием.
Основу проекта составляют полевые исследования, проводимые в северных районах полуострова, с целью фиксации живых речевых образцов носителей языка. В рамках проекта уже разработаны и внедрены следующие продукты: мобильное приложение Koryak tuyu для изучения языка, онлайн-словарь, прогнозы погоды на корякском языке и книга комиксов. Дополнительно проводятся аппаратные исследования артикуляторных характеристик корякского языка, пишет ТАСС.


