Apple выступает на CVPR 2026 в Денвере с демонстрациями по видео, жестовому языку и унифицированной токенизации

Новость

Редактор новостной ленты

5/30/2026, 6:39:51 PM

Apple выступает на CVPR 2026 в Денвере с демонстрациями по видео, жестовому языку и унифицированной токенизации

На CVPR 2026 в Денвере (3–7 июня) компания Apple спонсирует выставку и демонстрирует исследования и постеры по генеративному видео, жестовому языку, on‑device обучению и унифицированной токенизации;

Apple выступает спонсором IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) 2026, которая проходит в Colorado Convention Center в Денвере с 3 по 7 июня; на выставке компания представляет стенд #231 и ряд устных докладов и постеров, фокусируясь на генеративном видео, моделях для жестового языка, эффективном on‑device обучении и унифицированной токенизации для задач зрения. Это важно для разработчиков и исследователей, потому что представленные методы направлены на практическую интеграцию в мобильные и мультимодальные приложения.

В первый день, 3 июня, Apple участвует в нескольких воркшопах. В GenSign: Generative AI for Sign Language (комната 112) с 9:00 до 13:00 Colin Lea выступит с ключевым докладом. Параллельно проходит Efficient Deep Learning for Computer Vision (ECV) в комнате 502 с 9:00 до 18:00, где приглашённый докладчик — Oncel Tuzel; в воркшопе EDGE: Efficient and On‑Device Generation (комнаты 210/212) с 13:00 до 18:00 также заявлены приглашённые доклады Oncel Tuzel и Lu Jiang. Вечером организовано Mentorship Dinner WiCV с участием Hsin‑Ping (Cindy) Huang и Maggie Xiao от Apple.

4 июня запланирован воркшоп Video Large Language Models (VidLLMs) c 8:30 до 17:00 в комнатах 3A-3D, где приглашённый докладчик — Afshin Dehghan. На выставочных сессиях 5 июня (16:00 — 18:00) компания представит ряд постеров: STARFlow‑V: End‑to‑End Video Generative Modeling with Normalizing Flows (постер #178; авторы: Jiatao Gu и соавторы), From Where Things Are to What They’re For: Benchmarking Spatial‑Functional Intelligence for Multimodal LLMs (постер #453) и What Matters in Practical Learned Image Compression (постер #457).

В выходные добавляются дополнительные материалы и демонстрации. 6 июня ранний стендовый доклад Bootstrapping Sign Language Annotations with Sign Language Models пройдёт в секции Findings Posters с 07:30 до 09:00 (постер #035; Colin Lea и соавторы). В тот же день в Exhibition Hall F с 11:45 до 13:45 будет показан Velox: Learning Representations of 4D Geometry and Appearance (постер #527), а в Hall A с 16:45 до 18:45 — AMUSE: Audio‑Visual Benchmark and Alignment Framework (постер #146).

7 июня в 09:00 — 10:15 в Four Seasons Ballroom (Oral Session 5B) запланирован устный доклад AToken: A Unified Tokenizer For Vision — авторы Jiasen Lu, Liangchen Song и соавторы; позже в тот же день AToken также показан в формате постера. Программа охватывает практические темы: генеративное моделирование видео (STARFlow‑V), аннотации и моделирование жестового языка, аудио‑визуальное выравнивание (AMUSE), обучение представлений 4D (Velox) и унифицированную токенизацию для задач зрения (AToken).

Для тех, кто планирует посетить CVPR как практик или инженер: основными точками доступа к материалам являются устные сессии, стенд #231 и перечисленные постер‑сессии; большинство постеров, связанных с Apple, запланировано на 5–6 июня в Exhibition Hall A & F и Exhibition Hall F. Стенд #231 работает 5–7 июня: 10:00 — 18:00 в пятницу и субботу, 10:00 — 15:00 в воскресенье (все времена MDT); все расписания и временные метки в анонсе приведены по MDT, конференция проходит в очном формате.

Источники

Apple Machine Learning Research · 5/28/2026

Ответы (0)

Пока нет ответов в этой теме.