Наука, которую
хочется читать.

Мы переводим сложнейшие открытия человечества на язык, понятный каждому.
Planck.Media — твой квантовый скачок в мир большой науки.

9
Открытий
17
Категорий
Компьютерное зрение
3 min
ИИ научился видеть то, чего нет. И добавлять это на фото.

ИИ научился видеть то, чего нет. И добавлять это на фото.

«Исследователи разработали метод генерации реалистичных отражений для объектов, вставленных в составные изображения, с использованием диффузионной модели.»

Impact7/10
Wow8/10
Компьютерное зрение
3 min
Дрон, который понимает команды на русском, не умея его учить

Дрон, который понимает команды на русском, не умея его учить

«Предложена улучшенная модель Vision-Language-Action для точного и эффективного слежения с БПЛА в динамичных городских сценариях с семантическими требованиями.»

Impact7/10
Wow8/10
Компьютерное зрение
3 min
Как создать 3D-вселенную, если у вас почти нет 3D-данных?

Как создать 3D-вселенную, если у вас почти нет 3D-данных?

«Предложена 3D-нативная базовая модель Omni123, которая объединяет генерацию 2D и 3D объектов из текста в единой авторегрессионной архитектуре, используя обильные 2D-данные как геометрический приор для компенсации нехватки 3D-данных.»

Impact8/10
Wow8/10
Компьютерное зрение
3 min
Удалить объект из видео — просто. Удалить его влияние на мир — вот где начинается магия.

Удалить объект из видео — просто. Удалить его влияние на мир — вот где начинается магия.

«Предложен новый метод удаления объектов из видео, который корректирует не только визуальные артефакты, но и физические взаимодействия объектов.»

Impact8/10
Wow9/10
Компьютерное зрение
3 min
Самый простой способ понять видео оказался лучшим

Самый простой способ понять видео оказался лучшим

«Исследование показывает, что простой метод скользящего окна с использованием только последних N кадров и стандартной VLM сопоставим или превосходит сложные модели потокового видео.»

Impact8/10
Wow6/10
Компьютерное зрение
3 min
Как создать идеального 3D-двойника: нужно сначала сделать его плохим

Как создать идеального 3D-двойника: нужно сначала сделать его плохим

«Предложен новый метод создания высококачественных 3D-аватаров, который сочетает предобучение на миллионе видеороликов из реального мира с последующим дообучением на студийных данных для достижения высокой детализации и широкой обобщающей способности.»

Impact8/10
Wow8/10
Компьютерное зрение
3 min
ИИ видит кота, но не понимает, что это «тот самый, который сейчас нападет»

ИИ видит кота, но не понимает, что это «тот самый, который сейчас нападет»

«Исследователи представили новый эталонный тест и метод для визуального заземления, где цель нужно вывести из ролей, намерений и контекста, а не из прямого именования объектов.»

Impact7/10
Wow9/10
Компьютерное зрение
3 min
Чтобы научить ИИ видеть реальный мир, его кормят видеоиграми

Чтобы научить ИИ видеть реальный мир, его кормят видеоиграми

«Создан крупномасштабный динамический датасет из видеоигр AAA-класса и предложен новый метод оценки для улучшения инверсного и прямого рендеринга в реальных условиях.»

Impact8/10
Wow9/10
Компьютерное зрение
3 min
ИИ научился управлять толпой, но забыл, кто из них главный

ИИ научился управлять толпой, но забыл, кто из них главный

«Предложена модель ActionParty, которая решает проблему связывания действий с конкретными субъектами в видео, позволяя одновременно управлять несколькими агентами в сцене.»

Impact7/10
Wow8/10