MaGGIe представляет наборы данных I-HIM50K и M-HIM2K, содержащие более 180 000 синтезированных масок людей для оценки устойчивости матирования экземпляров.MaGGIe представляет наборы данных I-HIM50K и M-HIM2K, содержащие более 180 000 синтезированных масок людей для оценки устойчивости матирования экземпляров.

Синтез данных многоэкземплярного матирования человека с использованием MaskRCNN и BG20K

2025/12/20 02:30

Резюме и 1. Введение

  1. Связанные работы

  2. MaGGIe

    3.1. Эффективное маскированное управляемое извлечение экземпляров

    3.2. Временная согласованность матовых признаков

  3. Наборы данных для извлечения экземпляров

    4.1. Извлечение экземпляров изображений и 4.2. Извлечение экземпляров видео

  4. Эксперименты

    5.1. Предварительное обучение на данных изображений

    5.2. Обучение на видеоданных

  5. Обсуждение и ссылки

\ Дополнительный материал

  1. Детали архитектуры

  2. Извлечение изображений

    8.1. Генерация и подготовка набора данных

    8.2. Детали обучения

    8.3. Количественные детали

    8.4. Дополнительные качественные результаты на естественных изображениях

  3. Извлечение видео

    9.1. Генерация набора данных

    9.2. Детали обучения

    9.3. Количественные детали

    9.4. Дополнительные качественные результаты

8. Извлечение изображений

Этот раздел расширяет процесс извлечения изображений, предоставляя дополнительную информацию о генерации набора данных и всесторонние сравнения с существующими методами. Мы углубляемся в создание наборов данных I-HIM50K и M-HIM2K, предлагаем подробный количественный анализ и представляем дополнительные качественные результаты, чтобы подчеркнуть эффективность нашего подхода.

8.1. Генерация и подготовка набора данных

Набор данных I-HIM50K был синтезирован из набора данных HHM50K [50], который известен своей обширной коллекцией матовых изображений людей. Мы использовали модель MaskRCNN [14] Resnet-50 FPN 3x, обученную на наборе данных COCO, для фильтрации изображений с одним человеком, в результате чего получилось подмножество из 35 053 изображений. Следуя методологии InstMatt [49], эти изображения были скомпонованы на разнообразных фонах из набора данных BG20K [29], создавая многоэкземплярные сценарии с 2-5 субъектами на изображение. Субъекты были изменены в размере и расположены для сохранения реалистичного масштаба и избежания чрезмерного перекрытия, о чем свидетельствует IoU экземпляров, не превышающий 30%. Этот процесс дал 49 737 изображений в среднем по 2,28 экземпляра на изображение. Во время обучения маски управления генерировались путем бинаризации альфа-матов и применения операций случайного исключения, расширения и эрозии. Примеры изображений из I-HIM50K показаны на рис. 10.

\ Набор данных M-HIM2K был разработан для проверки устойчивости модели к различным качествам масок. Он включает десять масок на экземпляр, сгенерированных с использованием различных моделей MaskRCNN. Дополнительная информация о моделях, используемых для этого процесса генерации, показана в таблице 8. Маски были сопоставлены с экземплярами на основе наивысшего IoU с эталонными альфа-матами, обеспечивая минимальный порог IoU в 70%. Маски, которые не соответствовали этому порогу, были искусственно сгенерированы из эталонных данных. Этот процесс привел к созданию комплексного набора из 134 240 масок, из которых 117 660 для композитных и 16 600 для естественных изображений, обеспечивая надежный эталон для оценки маскированного управляемого извлечения экземпляров. Полный набор данных I-HIM50K и M-HIM2K будет выпущен после принятия этой работы.

\ Рисунок 10. Примеры набора данных I-HIM50K. (Лучше просматривать в цвете).

\ Таблица 8. Десять моделей с различным качеством масок используются в MHIM2K. Модели MaskRCNN взяты из detectron2, обученных на COCO с различными настройками.

\

:::info Авторы:

(1) Chuong Huynh, University of Maryland, College Park (chuonghm@cs.umd.edu);

(2) Seoung Wug Oh, Adobe Research (seoh,jolee@adobe.com);

(3) Abhinav Shrivastava, University of Maryland, College Park (abhinav@cs.umd.edu);

(4) Joon-Young Lee, Adobe Research (jolee@adobe.com).

:::


:::info Эта статья доступна на arxiv под лицензией CC by 4.0 Deed (Attribution 4.0 International).

:::

\

Возможности рынка
Логотип Multichain
Multichain Курс (MULTI)
$0.03835
$0.03835$0.03835
+3.03%
USD
График цены Multichain (MULTI) в реальном времени
Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу service@support.mexc.com для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.

Вам также может быть интересно

Прогноз Bitcoin на 2026 год: Ожидается высокая волатильность, но ATH в $250 000 возможен к 2027 году, заявляет Galaxy Research

Прогноз Bitcoin на 2026 год: Ожидается высокая волатильность, но ATH в $250 000 возможен к 2027 году, заявляет Galaxy Research

Статья "Прогноз Bitcoin на 2026 год: впереди высокая волатильность, но возможен ATH в $250 000 к 2027 году, заявляет Galaxy Research" появилась на BitcoinEthereumNews.com. COINOTAG News
Поделиться
BitcoinEthereumNews2025/12/20 09:45
Польский парламент возобновил рассмотрение законопроекта о регулировании криптовалют и передал его в Сенат

Польский парламент возобновил рассмотрение законопроекта о регулировании криптовалют и передал его в Сенат

Нижняя палата парламента Польши возродила спорный законопроект о криптовалюте, передав его в Сенат и вновь открыв дебаты о строгой национальной реализации MiCA. Парламент Польши
Поделиться
LiveBitcoinNews2025/12/20 11:30
Управляющий Федеральной резервной системы опровергает слухи о собеседовании на пост председателя

Управляющий Федеральной резервной системы опровергает слухи о собеседовании на пост председателя

Публикация «Управляющий Федеральной резервной системы опровергает слухи о собеседовании на должность председателя» появилась на BitcoinEthereumNews.com. Ключевые моменты: Слухи о собеседовании Уоллера на должность председателя ФРС опровергнуты
Поделиться
BitcoinEthereumNews2025/12/20 10:18