Российские исследователи на ICLR 2026 представили тест HUME и методы повышения качества ИИ-моделей

В Рио-де-Жанейро на конференции ICLR 2026 — одном из главных мировых событий в сфере машинного обучения — ученые Сбера вместе с российскими и международными коллегами представили работы, предлагающие прорывные решения для создания полезных и надежных ИИ‑помощников и повышения качества нейросетей.
По словам организаторов и докладчиков, в этом году акцент сместился на прикладное применение ИИ: в докладах все заметнее переход от преимущественных математических выкладок к реальным возможностям. Следующий этап развития ИИ описывается как переход к адаптивным системам, способным помогать человеку в обучении, работе, здоровье и развитии.
Среди представленных исследований — специальный тест HUME, созданный исследователями Сбера совместно с зарубежными коллегами. Он оценивает, насколько хорошо люди и современные модели ИИ справляются с анализом текста: классификацией, кластеризацией, поиском похожих текстов и ранжированием.
Результат, представленный в научной работе, оказался неожиданным: в среднем в повседневных задачах люди показывают точность 77,6 процента, а лучшие модели — 80,1 процента. При этом в сложных языках и тонких смысловых нюансах люди превосходят ИИ. Еще одна работа, представленная на основном треке ICLR 2026, — кросс‑национальное исследование авторов из Сбера и ряда международных университетов.
В нем ученые подошли к решению нескольких фундаментальных задач обучения ИИ‑моделей. Зачастую из‑за случайных факторов обучение приходится запускать многократно, а в стохастических задачах — усреднять результаты по множеству запусков, что неудобно на практике.
Исследователи впервые провели строгий анализ сходимости метода Clip‑SGD для последней, а не усредненной итерации. Это позволяет обучать модель один раз и быть уверенным в качестве полученных весов без многократных перезапусков. Также была представлена научная статья авторов из Сбера, Института AIRI и Сколтеха, предлагающая новый способ моделирования сложных систем.
Нейросеть учится предсказывать подпространства (базисы решений) по параметрам, используя специальную геометрию Грассмана для повышения точности. На воркшопе конференции исследователи Сбера, Института AIRI и Сколтеха презентовали еще одну работу — новый подход к обработке видео.
Модель специально обучают понимать связь между соседними кадрами во времени, а не обрабатывать каждый кадр отдельно. В рамках конференции Сбер организовал нетворкинг‑митап, который посетили более 200 участников международного ИИ‑сообщества. Мероприятие впервые прошло за пределами России.
Исследователи из США, Македонии, ОАЭ, Индии и других стран обсудили возможности глобального научного сотрудничества и последние тренды в генеративном искусственном интеллекте. Особое внимание гостей привлекла демонстрация ИИ‑решений Сбера, таких как нейросети GigaChat и Kandinsky.
