Skip to content

Latest commit

 

History

History
8 lines (7 loc) · 1.25 KB

README.md

File metadata and controls

8 lines (7 loc) · 1.25 KB

vk

  1. Для генерации финального вида train и test необходимо запустить features.ipynb. В результате будет создано 2 файла: new_test.csv и new_train.csv. При запуске features.ipynb необходимо скачать файл по ссылке (т.к. из-за его размера нельзя прикрепить csv) https://www.kaggle.com/datasets/mrdaniilak/russia-real-estate-2021 В файле создаются новые фичи с видоизменёнными локациями, определяются города. Кроме того, признаки собираются в 110 кластеров, чтобы в дальнейшем применить их к ранее неизвестным локациям.
  2. Train.ipynb тренирует модель XGBRegressor. Эта модель показала наилучший результат mae, который сравним с моделью Random forest. В результате генерируется model.pickle, который содержит обученную модель.
  3. solution.ipynb генерирует submission.csv. Использует весь new_train для предсказания.