Сравнительный анализ методов снижения дисбаланса классов при построении моделей машинного обучения в финансовом секторе
А. Ф. Константинов, Л. П. Дьяконова
Загрузить полный текст
Аннотация: В статье рассматриваются методы улучшения показателей качества моделей машинного обучения, применяемых в финансовом секторе. В связи с тем, что наборы данных, на которых обучаются модели, обладают несбалансированностью классов, предлагается использовать модели, направленные на снижение дисбаланса. В исследовании были проведены эксперименты с применением 9 методов учета несбалансированности классов к трем наборам данных по розничному кредитованию. В качестве базовой использовалась модель градиентного бустинга CatboostClassifier, не учитывающая дисбаланс классов. Проведенные эксперименты показали, что применение метода RandomOverSampler дает существенный прирост показателей качества классификации по сравнению с базовой моделью. Результаты свидетельствуют о перспективности дальнейших исследований методов учета дисбаланса классов при изучении финансовых данных, а также о целесообразности применения рассмотренных методов на практике.
Ключевые слова: финансовые риски, машинное обучение, классификация, дисбаланс классов.
Для цитирования. Константинов А. Ф., Дьяконова Л. П. Сравнительный анализ методов снижения дисбаланса классов при построении моделей машинного обучения в финансовом секторе // Известия Кабардино-Балкарского научного центра РАН. 2025. Т. 27. № 1. С. 143–151. DOI: 10.35330/1991-6639-2025-27-1-143-151