ИИ видит кота, но не понимает, что это «тот самый, который сейчас нападет»

Это как если бы вы в кризисной ситуации крикнули другу: «Дай то, чем можно вытереть!» — и он, вместо того чтобы схватить тряпку, начал перечислять все предметы в комнате, которые теоретически могут впитывать жидкость.

Исследователи создали новый тест — Referring Scenario Comprehension (RSC). Вместо простых запросов вроде «синяя машина» ИИ получает целые абзацы с описанием ролей, намерений и контекста.

Пример задачи: «Найди предмет, который человек использует, чтобы дотянуться до высокой полки, пока его ребенок пытается схватить его за ногу». Это может быть табуретка, стул или коробка — но не диван или ковер.
Сложность помечена: Каждый пример имеет теги сложности: уникальность объекта, загроможденность сцены, размер, перекрытие с другими объектами. Это помогает понять, где именно ИИ ошибается.
Метод ScenGround: Ученые предложили метод обучения, где ИИ сначала «разминается» на простых задачах, а затем с помощью проб и ошибок (reinforcement learning) учится решать сложные, начиная с тех, что помечены как легкие.
Результат: Оказалось, что современные модели, блестяще справляющиеся со стандартными тестами, систематически проваливаются на таких сценариях. Обучение по новой методике не только улучшает результаты на сложных случаях, но и помогает в традиционных задачах.

ИИ видит кота, но не понимает, что это «тот самый, который сейчас нападет»

Стоп, что?

Что это значит для вас

📚 Глоссарий этого выпуска