Интеллектуальная система, созданная на платформе Yandex AI Studio, представляет собой инновационное решение для автоматизации обработки текстовых данных на восточных языках. Она способна анализировать до тысячи источников информации ежедневно, что существенно превосходит традиционные методы, требующие до десяти часов на выполнение аналогичной задачи. Это значительно сокращает время, затрачиваемое исследователями на работу с материалами из Азии, Африки и Ближнего Востока, и открывает новые возможности для более глубокого и оперативного анализа.
Доступ к оригинальным публикациям по восточным странам зачастую ограничен, так как большинство из них выходят на национальных языках и редко подвергаются переводу. Это создает значительные препятствия для научных исследований и может приводить к искажению данных вследствие англоязычных интерпретаций. Интеллектуальная система, разработанная «Яндексом» в сотрудничестве с Институтом востоковедения РАН, позволяет преодолеть эти барьеры, обеспечивая автоматизированный анализ научных трудов, выделение ключевых фактов и формирование аналитических резюме.
Особое внимание уделяется анализу публикаций в китайских СМИ, для которых система готовит русскоязычные дайджесты, предоставляя исследователям актуальную информацию о событиях в регионе в реальном времени. Обучение моделей осуществлялось специалистами Yandex Cloud и студентами Школы анализа данных с использованием обширного архива востоковедных знаний РАН, включающего более полутора миллионов документов на четырех вариантах китайского языка.
Доктор Александр Костыркин из Лаборатории цифровых исследований современного Востока РАН отмечает, что применение искусственного интеллекта позволяет ускорить процесс анализа материалов в 6-8 раз. Теперь исследователям достаточно всего 10-15 минут для поиска, обработки и анализа необходимой информации, тогда как ранее этот процесс отнимал несколько часов. Это не только увеличивает объем обрабатываемых источников, но и способствует углублению анализа и формированию более полного представления о региональных тенденциях.
Анна Лемякина из Yandex Cloud подчеркивает важность работы с первоисточниками для востоковедов, отмечая, что искусственный интеллект значительно ускоряет, повышает точность и глубину анализа, предоставляя доступ к ранее труднодоступным данным.
В перспективе планируется расширение функциональности системы путем добавления поддержки японского, арабского, турецкого, персидского и других восточных языков, что позволит охватить еще более широкий спектр исследований и повысить их качество и достоверность, пишет источник.