Один умный ИИ оказался эффективнее целого совета мудрецов

Impact8/10

Wow Factor7/10

«Исследование показывает, что при фиксированном бюджете вычислительных токенов одноагентные LLM-системы эффективнее или сопоставимы с мультиагентными архитектурами в задачах многошагового рассуждения.»

Это как если бы вы наняли пять консультантов для ремонта квартиры, но они просто пересказывали бы друг другу одни и те же идеи, сжигая ваш бюджет на часах. А один хороший специалист сделал бы всё быстрее и дешевле.

Учёные сравнили одиночные ИИ (SAS) и многоагентные системы (MAS) в решении сложных логических задач (multi-hop reasoning).

Ключевое правило: у всех был одинаковый «бюджет мыслей» — ограниченное число «токенов» (условных единиц вычислений).

Что обнаружили:

Когда бюджет равен, один мощный ИИ сопоставим или превосходит целую команду агентов.
Преимущество команд часто возникает из-за скрытых затрат — им просто дают больше ресурсов для размышлений.
Исследователи нашли артефакты в тестах и API (особенно у Gemini 2.5), которые искусственно завышали результаты команд.
С точки зрения теории информации (Data Processing Inequality), один агент, идеально использующий контекст, более эффективен.

Вывод исследования: многие заявленные победы «команд ИИ» объясняются не магией архитектуры, а неучтёнными вычислениями и сбоями в оценке.

Один умный ИИ оказался эффективнее целого совета мудрецов

Стоп, что?

Что это значит для вас

📚 Глоссарий этого выпуска