Skip to content

Data analysis competition on the subject of vehicles and transportation

Notifications You must be signed in to change notification settings

MekhailS/datascience-contest

Repository files navigation

Конкурс для начинающих аналитиков данных

Краткое описание файлов:

.ipynb:

  • eda - Подготовка данных (конструирование единых таблиц для каждого ТС) и разведовательный анализ (с помощью pandas_profiling отчетов) именно здесь была обнаружена ошибка в refueling2
  • refueling eda - Анализ refueling2
  • rolling_data - Выбор метода сглаживания fuellevel
  • interval extraction - Все измерения группируются по интервалам с небольшой разницей между измерениями во времени внутри одного интервала. Далее каждый интервал разбивается на промежутки возрастания/убывания. Возрастания классифицируются как заправки, убывания кллассифицируются либо как штатный расход, либо как слив в зависимости от скорости убывания топлива и уменьшения объема топлива за интервал.
  • fuel level shift - Анализ событий изменения уровня топлива
  • problems1_2-preparation - Подготовка данных для решения 1 и 2 задач (создание матрицы строками которой являются события изменения уровня топлива, столбцы - то, как мы их характеризуем
  • problems1_2-clustering - Попытка решить 1 и 2 задачи предполагая, что 1 и 2 задачи являются задачами без учителя (т.к. refueling некорректный)
  • problems1_2-classification - Попытка решить 1 и 2 задачи предполагая, что 1 и 2 задачи являются задачами с учителем (допустим refueling корректный) (построение двух классификаторов, оба провалились)
  • problems3_6 - Попытка классифицировать ТС по скорости, расходу топлива, емкости бака.
  • problem6 - Разделение ТС по типам с помощью иерархической кластеризации.
  • constants-and-functions - Код с константами и часто используемыми самописными функциями

folders:

  • data/ - Все данные, связанные непосредственно с задачей
    • data/vehicle_dataset_public - Выданные данные
    • data/vehicle_proccessed - Предобработанные данные с графиками и отчетами
      • data/vehicle_proccessed/reports - pandas_profiling отчеты по данным, на их базе делается разведовательный анализ
      • data/vehicle_proccessed/plots - Графики уровня топлива

About

Data analysis competition on the subject of vehicles and transportation

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published