Эта нейросеть проектирует себя сама. И это не метафора.

Представьте, что вы строите дом, не зная, для чего он: для семьи, для офиса или для склада. Вы на всякий случай закладываете лишние комнаты, этажи и окна. Именно так мы сегодня создаем ИИ — с огромным запасом, который потом приходится вручную «обрезать».

Ученые представили модель DDCL-INCRT, которая определяет свою собственную структуру в процессе обучения. Вместо того чтобы заранее задавать количество «внимания» (attention heads) и слоев, она начинает с минимума и наращивает сложность только тогда, когда это действительно нужно.

Как это работает?

DDCL (Deep Dual Competitive Learning): Заменяет стандартные блоки на «словарь» из прототипов — ключевых паттернов в данных. Эти прототипы автоматически отталкиваются друг от друга, выстраивая четкую иерархию.
INCRT (Incremental Transformer): Начинает с одного «внимания» и добавляет новое только тогда, когда текущих уже не хватает, чтобы уловить важную информацию.

Главный теоретический результат: Эти два механизма усиливают друг друга. Каждый новый «уровень внимания» улучшает разделение прототипов, что, в свою очередь, сигнализирует о необходимости добавить еще один. В итоге сеть самоорганизуется в уникальную и минимальную иерархию — ровно такую, какая нужна для задачи. Исследователи дали формальные гарантии ее стабильности и сходимости.

Эта нейросеть проектирует себя сама. И это не метафора.

Стоп, что?

Что это значит для вас

📚 Глоссарий этого выпуска