Skip to content

Latest commit

 

History

History
51 lines (25 loc) · 4.3 KB

README.md

File metadata and controls

51 lines (25 loc) · 4.3 KB

PicsArt AI Hackathon Online

Материалы к онлайн этапу PicsArt AI Hackathon.

Постановка задачи

Участникам соревнования предлагается решить задачу отделения человека на фотографии от фона. По изображению необходимо построить бинарную маску, в которой указать пиксели относящиеся к человеку. Пример масок сегментации:

Набор данных

Ссылка на набор изображений: picsart_hack_online_data.zip

Для обучения моделей предоставляется выборка из ≈1500 размеченных картинок (каталог train) и масок сегментации (каталог train_mask). Маски представляю собой одноканальные изображения той же размерности, что и исходные изображения, и имеют только два значения цвета. Для оценки решений предоставляется тестовая выборка без соотвествующих масок (каталог test).

Формат решения

В качестве решения необходимо построить разметку всех изображений из каталога test.

Маски необходимо закодировать в формате run-length encoding (RLE) и записать в CSV-файл. Формат RLE заключается в том что в строчку последовательно записываются пары чисел: номер стартового пикселя и число последовательно идущих пикселей, относящихся к маске. Например: '1 3 10 5' означает что маска состоит из пикселей с индексами 1,2,3,10,11,12,13,14. Пары должны быть отсортированы по возрастанию стартового пикселя, не должны пересекаться. Нумерация пикселей происходит c 1, сверху вних, затем слева направо: 1 означает пиксель (1,1), 2 — (2,1) и т.д.

Код для кодирования и декодирования формата RLE можно найти в utils.py.

В проверяющую систему необходимо отправить файл с предсказаниями в формате csv, содержащий следующие колонки:

  • image — номер изображения, указанный в имени файла (например, 11150)
  • rle_mask — построенная маска, закодированная при помощи run-length encoding

Пример файла решения: sample_submission.csv

Система оценки

Качество сегментации для каждого изображения оценивается с помощью Dice Score:

$$\frac{2 \cdot |X \cap Y|}{|X| + |Y|}$$

где X — предсказанная маска, Y — правильная маска из разметки, |X| — число пикселей, попавших в маску X.

Dice Score усредняется по всем тестовым изоражениям, имеющим разметку.

Функции для вычисления качества можно найти в utils.py.

Пример решения

Пример решения приведен в Jupyter NotebookPicsartHack_Baseline.ipynb