ArXiv: Группа ученых создала новый метод и научила ИИ лучше мыслить логически

Анастасия Федосеева Главный редактор

Группа ученых из Сколковского института науки и технологий (Сколтех), Московского физико-технического института (МФТИ), AIRI и Университета Париж-Ситэ разработала методологию QK-score для оценки логической целостности больших языковых моделей (LLM). В отличие от традиционных подходов, которые сосредотачиваются только на конечном результате, новая методика исследует внутренние процессы нейронных сетей. Она выявляет скрытые закономерности и оценивает логическую корректность на каждом этапе обработки данных.

Эксперименты с моделями, содержащими от 1,5 до 70 миллиардов параметров, показали превосходство QK-score над существующими методами. Методика также продемонстрировала устойчивость к внешним отвлекающим факторам. Лаида Кушнарева из Huawei подтвердила важность анализа "голов внимания" с высоким QK-score. Она отметила, что их отключение значительно ухудшает качество генерируемых ответов.

Методика QK-score не требует изменений в архитектуре модели и может быть применена за один проход. Эдуард Тульчинский из Сколтеха подчеркнул, что этот подход позволяет выявлять и исправлять логические ошибки в процессе генерации текста. Анастасия Вознюк из МФТИ отметила высокую эффективность методики в решении сложных логических задач.

Исследование углубляет понимание механизмов обработки абстрактной информации трансформационными моделями и открывает перспективы их применения в различных областях, таких как юриспруденция, медицина и наука. В будущем планируется совершенствование методики QK-score для адаптации к специализированным задачам и ее интеграции в системы генерации текста, пишет источник.