В РФ успешно завершили испытания ИИ, анализирующего тексты на китайском языке

Эксперты компании «Яндекс» в коллаборации с Инс...

фото: фрипик

Эксперты компании «Яндекс» в коллаборации с Институтом востоковедения Российской академии наук разработали инновационную систему на основе искусственного интеллекта, предназначенную для ускоренного анализа текстов на восточных языках. Это решение предоставляет исследователям возможность ежедневно обрабатывать до тысячи первоисточников из стран Азии, Ближнего Востока и Африки, что значительно повышает эффективность академических исследований в данной области.

Цифровая трансформация, инициированная в Институте востоковедения, стала катализатором для реализации данного проекта. Директор института, Аликбер Аликберов, подчеркнул, что партнерство с «Яндексом» не только увеличивает объем и глубину анализа, но и сохраняет академическую фундаментальность исследований, что является критически важным для научных изысканий.

Система была создана на платформе Yandex AI Studio, при активном участии специалистов Yandex Cloud и студентов Школы анализа данных. Нейронные сети, обученные на обширном корпусе научных текстов, способны выделять ключевые факты и генерировать краткие обзоры, что существенно упрощает процесс обработки информации. Кроме того, система обладает возможностью анализировать публикации китайских СМИ и создавать дайджесты на русском языке, что обеспечивает оперативное получение актуальной информации о регионе.

Информационной основой для искусственного интеллекта послужил архивный фонд Института востоковедения, включающий более полутора миллионов документов, написанных на четырех диалектах китайского языка. В перспективе планируется расширение функциональности системы, что позволит ей поддерживать японский, арабский, турецкий, персидский и другие восточные языки, открывая доступ российским ученым к уникальным источникам информации.

Старший научный сотрудник Института востоковедения РАН, Александр Костыркин, отметил, что ранее анализ материалов требовал значительных временных затрат, ограничивая количество обрабатываемых источников. Внедрение искусственного интеллекта позволило существенно сократить этот процесс, теперь одна исследовательская задача занимает всего 10-15 минут, что способствует увеличению объема обрабатываемых материалов и углублению анализа тенденций.

Таким образом, разработанная система на базе искусственного интеллекта представляет собой значительный шаг вперед в области автоматизации анализа восточных текстов, что открывает новые горизонты для научных исследований и способствует более глубокому пониманию культурных и исторических процессов в регионах Азии, Ближнего Востока и Африки, пишет источник.