Первое соревнование от МТС Digital Big Data по определению пола/возраста владельца cookie длительностью два месяца.
«Я тебя по IP вычислю!» – помните такую угрозу из интернета времен нулевых? Мы в МТС Digital решили выяснить, можно ли составить хотя бы приблизительное представление о человеке, обладая информацией о сайтах, которые он посещает. Для этого мы сгенерировали полусинтетические данные.
Вопрос звучит так: сможем ли мы по таким цифровым следам пользователя (на каких сайтах с каких IP он сидел, сколько раз заходил, какое у него устройство) понять, кто этот пользователь? Студент или пенсионер? Мужчина или женщина?
Действительно, в Digital-рекламе часто сегмент включает себя пол и один из бакетов по возрасту (Класс 1 —19-25, Класс 2 —26-35, Класс 3 —36-45, Класс 4 —46-55, Класс 5 —56-65, Класс 6— 66+). Эта задача особенно актуальна для рекламных DSP-площадок, которые в OpenRTB запросах получают такие данные с частотой 200 000 запросов в секунду со всех сайтов, размещающих рекламу за деньги.
Определение пола и возраста владельца HTTP cookie по истории активности пользователя в интернете на основе синтетических данных.