В этом репозитории ты сможешь найти формальные правила участия, несколько идей, а также датасеты, которые могут пригодиться при построении моделей. Вот в этой таблице ты также можешь найти список участниц Miss MIPT и их награды. Пишите нам в группу VK, если вы хотите заполнить пропуски таблицы (но мы постарались откопать как можно больше данных).
Мы попросим вас прогнать ваши алгоритмы на основе этих данных о текущих участницах Мисс Физтех.
- Имя
- Фамилия
- Дата рождения
- Курс
- Факультет
- Состоишь ли ты в студенческих объединениях?
- Зачем тебе конкурс?
- Контактный номер телефона
- Ссылка на страницу ВКонтакте
- Аккаунт в Instagram
Придумай "метрику мисс-миптовости", "линейку физтех-красоты", "штангенциркуль крутости физтешки"! Иными словами, запрогай что-то, что сможет отранжировать кандидаток в Мисс Физтех и выбрать лучшую.
Перед самым финалом, мы
- Прогоним все присланные метрики на новый участницах,
- Усредним результаты,
- Выберем ТУ САМУЮ и
- Наградим в специальной номинации.
- Ваша программа должна уметь получать на вход какое-то свойство участницы, а на выход выдавать рейтинг частницы с таким свойством. Чем выше рейтинг - тем ближе участница к званию Мисс Мипт (написано запутанно, надеюсь, будет понятней на примерах ниже).
- Код алгоритма / метрики должен быть загружен в публичный репозиторий на GitHub / Gitlab, а ссылка на него прислана в группу Хакатона Мисс Физтех.
- В репозитории должно быть указано:
- В каком формате подавать вашему алгоритму данные на вход,
- Поверхностное описание вашего алгоритма,
- Как получить и интерпретировать выходные результаты вашего алгоритма.
- Если алгоритм подразумевает некое "обучение", в репозитории должна быть выложена уже обученная модель.
- Если ваш алгоритм использует какие-нибудь сторонние данные, в ваш репозиторий должен быть загружен скрипт, который позволит нам выкачать необходимые данные о будущей участнице.
- Если ваш алгоритм подразумевает нарушение одного из вышеперечисленных пунктов, просьба связаться с организаторами - договоримся.
Есть фотографии участниц с отбора, есть победительницы прошлых лет. Все просто.
Вы обучили сеточку, которая просто выдает вероятность победы участницы с данным фото. В репозиторий вы выложили обученную модель, указали, как можно подать ей на вход фотографию и как интерпретировать выходные данные.
Жюри скачает фотографии участниц с отбора, прогонит их всех через вашу модель. Если у участницы будет больше одной фотографии, жюри, например, усреднит результаты.
А можно вообще сказать, что жюри конкурса в прошлые года было очень biased, поэтому ориентироваться на их решение неправильно и ненаучно. Вместо этого взять и доверить выбор лучшей физтешки уже обученным нейронным сетям.
Усреднить фотографии победительниц Мисс Мипт и в качестве рейтинга выдавать "расстояние до идеальной-усредненной мисс мипт". На вход подается картинка (ссылка на файл или сам файл), а на выходе число - чем оно больше, тем ближе человек на фото к мисс мипт!
Допустим, ваша команда аналитиков выявила закономерность: чем круче Instagram профиль конкурсантки, тем больше она достойна победы в конкурсе. При этом вы солидарны с жюри прошлых лет и обучили свою модель на прошлогодних победительницах.
В итоге вы разработали алгоритм, который
- На вход получает Instagram username конкурсантки
- На выходе выдает число, которое определяет вероятность победы участницы с этим инстаграмм профилем
- В описании алгоритма вы указали, какую веростность проставлять тем участницам, у которых нет инстаграмм аккаунта или у которых профиль закрытый.
- Так как ваша метрика "крутости инстаграм профиля" использует данные о подписчиках профиля, вы указали, что необходимо будет спарсить актуальные данные для новых участниц и положить их в такую-то папку в таком-то формате.
Ваши аналитики выяснили, что чем больше доля инстаграмм подписчиков с физтеха / подписок на физтехов, тем больше потенциальная группа поддержки участницы и шансов выиграть в конкурсе. Вы разработали программу, которая получает на вход *.csv
файл со списком инстгарамм подписчиков и подписок участницы, измеряет доли физтехов в этих группах и на их основе выдает рейтинг.
Вопросы кидайте в группу