Определите тип статистических данных с помощью python pandas - PullRequest
0 голосов
/ 10 апреля 2020

Я знаком с Python, но он не знаком с аспектом статистики / науки о данных.

Кажется, что одним из первых шагов при работе с данными является определение типа данных, которые вы работаем с. По типу данных я ссылаюсь на Числовой> Продолжить / Дискретный> Интервал / Соотношение и Категориальный> Порядковый / Номинальный.

Существует ли существующий класс / функция, которая делает это хорошо? Я знаю, что некоторые аспекты являются контекстно-чувствительными, поэтому они не всегда будут черными или белыми. Я также имею в виду необработанные данные, которые не обязательно были классифицированы.

Я знаю о dtype danda, но это дает ограниченное представление о данных. например. Столбец ID можно рассматривать как числовой, где он должен быть категоричным. Или 1 и 0 в столбце могут быть числовыми, но на самом деле это логическое значение, поэтому категориальное> номинальное.

...