Все открытия
03.04.20263 мин чтения

Чат-бот с картинками учит лучше, чем без них. А чат-бот без картинок — хуже, чем просто учебник.

Impact8/10
Wow Factor7/10

«Исследование показывает, что мультимодальный диалоговый ИИ, предоставляющий ответы с текстом и изображениями, приводит к наилучшим результатам обучения биологии, в то время как только текстовый диалоговый ИИ повышает вовлечённость, но ухудшает результаты.»

ИИ-репетитор, с которым приятно болтать, может ухудшить ваши оценки. А если добавить к нему картинки — он станет лучшим учителем.

Стоп, что?

Увлекательность ≠ эффективность.

Это как если бы самый весёлый тренер в зале помогал вам только *чувствовать* себя сильным, а не становиться им. Исследователи проверили, как разные ИИ помогают учить биологию.

Что сделали: 124 человека учили биологию с помощью трёх разных инструментов:

  1. MuDoC: Умный чат, который отвечает текстом и показывает картинки из учебника.
  2. TexDoC: Такой же умный чат, но только с текстом.
  3. DocSearch: Просто учебник с удобным поиском (как улучшенный PDF).

Что вышло (сюрприз!):

  • Лучшие результаты были у тех, кто учился с MuDoC (чат + картинки).
  • Самые низкие результаты — у группы TexDoC (только чат). Причём эти же люди назвали его самым увлекательным и простым!
  • Учебник с поиском (DocSearch) оказался эффективнее, чем увлекательный, но "слепой" чат-бот.

Почему так? Учёные объясняют это через теорию когнитивной нагрузки:

  • Болтовня с ботом (conversationality) снижает «мусорную» нагрузку — стало проще искать информацию.
  • Картинки + текст (multimodality) создают полезную нагрузку — мозг активнее связывает concepts, и знания усваиваются.
  • Без картинок мозг расслабляется, создаётся иллюзия понимания, но знания не закрепляются.

Что это значит для вас

Так что важнее для вашего следующего онлайн-курса: чтобы вам было интересно или чтобы вы действительно чему-то научились?

📚 Глоссарий этого выпуска

MLLM (Multimodal Large Language Model)
ИИ, который понимает и генерирует не только текст, но и изображения, например, GPT-4V.
Когнитивная нагрузка
Объём умственных усилий, который требуется для обработки информации. Делится на полезную (для обучения) и бесполезную (для преодоления неудобного интерфейса).
Germane load
Полезная когнитивная нагрузка, которая тратится именно на создание новых связей в памяти и глубокое понимание.
Extraneous load
Бесполезная когнитивная нагрузка, которая тратится на борьбу с плохим дизайном, отвлечениями или confusing инструкциями.