У меня есть большой набор данных, который содержит ежегодные связи компаний.В этом наборе данных я хочу обнаружить ошибки / выбросы.Эти выбросы являются в основном человеческими ошибками.У меня проблемы с выбором, какая стратегия лучше всего подходит для этой проблемы, поскольку мои данные распределяются некорректно.
Мой набор данных содержит около 100 столбцов.
Есть ли у кого-нибудь сведения о методах обнаружения ошибок человека?Подумайте об ошибке запятой, во многих нулях, т. Д.
Заранее спасибо