LightAutoML на наших фичах - логарифмированных и смысловых которые придумали в ходе анализа.
Фичи:
-
Сырые признаки
-
Логарифмирование исходных количественных данных
Приводит лог-нормально распределенные признаки к нормально распределенным
-
Препроцессинг этажей
-
Генератор фич
Производит бинарные и унарные операции над имеющимися признаками. В последствии модель сама выделяет нужные признаки, а бесполезные для предсказания отбрасывает
-
Ипотечная ставка Нашли зависимость целевой переменной от размера ипотечной ставки за прошлые даты
-
Расчет соцдем признаков Оценка населения в городе
-
Данные о метро
Дополнительные файлы:
Найдены в опубликованных решениях других участников
- Данные о популяции
- Зарплатная ведомость
Используется конфигуриромый скриптом запуск пайплайна обработки данных и обучения
Например
./run_solution.sh catboost