- разбейтесь на команды по 1-6 человек и придумайте ей название
- решите какую проблему, Вы хотите решать
- создайте репозиторий на гитхабе и кладите в него весь код
- предлагаемый тайм-лайн хакатона:
- 14:00--15:00 разбиение на команды, выбор проекта, обсуждение плана проекта, разделение обязанностей среди участников, создание репозитория проекта
- 16:00--19:00 активная разработка проекта
- 19:00--20:00 команда готовится к презентации результатов проекта
- 20:00--21:00 все прекращают работать (к этому времени, и презентация, и все рабочие материалы группы должны быть в репозитории) и слушают презентации проектов
Не стесняйтесь задавать вопросы менторам, если что-то не получается. Не стесняйтесь перемешивать языки: если что-то не получается в R, сделайте на Python, если так проще.
Ссылка на общий jitsi. Первые 2 часа я буду доступен только в телеграме, потом ближе к 16 я приду и все время буду сидеть в jitsi.
Существует такой жанр текстов, как гороскопы. В данном задании предлагается проанализировать тексты гороскопов из самого популярного телеграм-канала с гороскопами --- @moygoroskop (телеграмм позволяет выкачать любой чат или канал в .html
и json
). Создайте датасет с переменными дата -- знак зодиака -- текст и проанализируйте его. Можно ли наблюдать какую-то цикличность в особенностях текстов предсказаний? Существуют ли какие-то особенности текстов предсказаний, связанные с каким-то знаком? Можно подумать и в другую сторону: попробовать сделать генератор предсказаний.
Существует статья "Палитра русской классики" Л. Поповец, проект цветолингвистика О. Стоговой или недавний пост ЦУН Библиотека им. Н.А. Некрасова. Попробуйте проанализировать цвета в собранном нами корпусе фантастики.
В какой-то момент на занятиях мы обсуждали разницу энтропии между разными авторами. Посчитайте энтропию в собранном нами корпусе фантастики и проанализируйте, что это мера может нам сказать о произведениях.