- Для генерации финального вида train и test необходимо запустить features.ipynb. В результате будет создано 2 файла: new_test.csv и new_train.csv. При запуске features.ipynb необходимо скачать файл по ссылке (т.к. из-за его размера нельзя прикрепить csv) https://www.kaggle.com/datasets/mrdaniilak/russia-real-estate-2021 В файле создаются новые фичи с видоизменёнными локациями, определяются города. Кроме того, признаки собираются в 110 кластеров, чтобы в дальнейшем применить их к ранее неизвестным локациям.
- Train.ipynb тренирует модель XGBRegressor. Эта модель показала наилучший результат mae, который сравним с моделью Random forest. В результате генерируется model.pickle, который содержит обученную модель.
- solution.ipynb генерирует submission.csv. Использует весь new_train для предсказания.
-
Notifications
You must be signed in to change notification settings - Fork 0
spirinamayya/vk
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
Repository files navigation
About
No description, website, or topics provided.
Resources
Stars
Watchers
Forks
Releases
No releases published
Packages 0
No packages published