Один умный ИИ оказался эффективнее целого совета мудрецов
«Исследование показывает, что при фиксированном бюджете вычислительных токенов одноагентные LLM-системы эффективнее или сопоставимы с мультиагентными архитектурами в задачах многошагового рассуждения.»
Стоп, что?
Больше агентов — не значит умнее.
Это как если бы вы наняли пять консультантов для ремонта квартиры, но они просто пересказывали бы друг другу одни и те же идеи, сжигая ваш бюджет на часах. А один хороший специалист сделал бы всё быстрее и дешевле.
Учёные сравнили одиночные ИИ (SAS) и многоагентные системы (MAS) в решении сложных логических задач (multi-hop reasoning).
Ключевое правило: у всех был одинаковый «бюджет мыслей» — ограниченное число «токенов» (условных единиц вычислений).
Что обнаружили:
- Когда бюджет равен, один мощный ИИ сопоставим или превосходит целую команду агентов.
- Преимущество команд часто возникает из-за скрытых затрат — им просто дают больше ресурсов для размышлений.
- Исследователи нашли артефакты в тестах и API (особенно у Gemini 2.5), которые искусственно завышали результаты команд.
- С точки зрения теории информации (Data Processing Inequality), один агент, идеально использующий контекст, более эффективен.
Вывод исследования: многие заявленные победы «команд ИИ» объясняются не магией архитектуры, а неучтёнными вычислениями и сбоями в оценке.
Что это значит для вас
Так что, в погоне за «агентностью», мы просто платим за более дорогой и сложный способ заставить ИИ... дольше думать?