Репозиторий, содержащий тестовое задание для стажировки JetBrains.
Были предоставлены данные о цитируемости научных статей через 5 лет после публикации. Каждая строка данных характеризует определенную статью. Задача состоит в том, чтобы предсказать переменную с5 - цитируемость научной статьи через 5 лет после ее публикации.
git clone https://github.com/Phinnik/article_citation.git
virtualenv venv
venv\Scripts\activate.bat
pip install -r requirements.txt
В папке data содержится файл с данными data.csv, в котором лежит предоставленный по заданию датасет.
article_citation.ipynb - jupyter тетрадка с моей версией решения задания.