Айдын Абиров
Computer Vision engineer @ Wildberries
Москва

Решаем задачу Action Recognition

  • Категории: MLDataConf
  • Секции: ML

Описание:

Аннотация

Доклад посвящен обзору современных методов Action Recognition с акцентом на задачу Temporal Action Recognition в видео. Я рассмотрю теоретические основы различных подходов, от CNN-based до SSL backbone в купе с ActionFormer. Особое внимание уделено практическому решению конкретного кейса на складе Wildberries. Я покажу преимущества и минусы разных подходов и рекомендации по выбору архитектуры в зависимости от специфики задачи.

Содержание (предварительное)

- Теоретические основы Action Recognition

- Temporal Action Recognition как ключевая задача

- Практический кейс и его решение

- Архитектурные решения и метрики, включая разные эксперименты по VideoMAEv2, ActionFormer, EVR, итд

- Практическая значимость

- Заключение

О спикере

Айдын Абиров

Computer Vision engineer @ Wildberries
Москва

Меня зовут Айдын.

Я инженер компьютерного зрения в компании Wildberries. Работаю на проекте Видеоаналитики на складах.

Закончил бакалавр и магистратуру в Китае, в Нанкинском университете Науки и Технологии.

Говорю на 4-х языках

Буду очень рад выступить у вас на конференции)

Похожие доклады
Архитектура платформы обработки и хранения данных для обучения GenAI моделей
Сложности и хитрости при разработки приложений с LLM / мысли почему перенесли Apple Intelligence на год.