иметь дело с проблемой обнаружения мошенничества экстремального класса - PullRequest
0 голосов
/ 22 апреля 2020

Я строю прогностическую модель в телекоммуникационной компании, в которой мошеннические транзакции в случае проблемы, над которой я работаю, составляют менее 1%. Набор данных, над которым я работаю для обучения, содержит 4800 примеров, 1600 из них - мошеннический. Я попытался сократить их до 900 примеров (без методов выборки я сократил их, используя некоторый анализ и статистику, чтобы попытаться включить большинство случаев), что составляет 18% мошеннических примеров. я должен уменьшить это больше к 10%, например? и как узнать правильный процент использования класса мошенничества?
Я задаю этот вопрос, потому что считаю, что модель должна обучаться на балансе классов, близком к реальному случаю.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...