Как создать идеального 3D-двойника: нужно сначала сделать его плохим

Impact8/10

Wow Factor8/10

«Предложен новый метод создания высококачественных 3D-аватаров, который сочетает предобучение на миллионе видеороликов из реального мира с последующим дообучением на студийных данных для достижения высокой детализации и широкой обобщающей способности.»

Представьте, что вы хотите создать идеальную 3D-копию человека. Можно снять его в студии с 50 камерами — получится детально, но только для него одного. А можно скормить ИИ миллионы роликов с YouTube — получится универсально, но размыто и криво. Что выбрать?

Учёные нашли третий путь — «предобучение и дообучение».

Фаза 1: Стать гением-самоучкой. Нейросеть LCA анализирует 1 000 000 «диких» видео (с телефонов, веб-камер). Здесь она учится общим принципам: как выглядит человек в разной одежде, при разном свете, с разной причёской.
Фаза 2: Стать виртуозом. Потом модель «допиливают» на маленьком, но идеальном студийном наборе данных. Здесь она учится тонкостям: микромимике, изгибам пальцев, игре света на коже.

Результат (без прикрас):

Аватар работает на лету (feedforward), без долгой обработки.
Он обобщает — создаёт двойников людей, которых никогда не видел в студии.
Появились неожиданные способности (emergent properties): модель сама научилась пересвечивать аватар под новый свет и работать со свободной одеждой, хотя её этому не учили.
Она понимает даже стилизованные изображения (аниме, картины) в «нулевом» режиме (zero-shot).

Как создать идеального 3D-двойника: нужно сначала сделать его плохим

Стоп, что?

Что это значит для вас

📚 Глоссарий этого выпуска

🖼️ Визуальный ряд исследования