Различение числовых и категориальных столбцов - PullRequest
0 голосов
/ 27 февраля 2019

Я начал работать в компании, и мы используем много таблиц данных, большинство из которых не содержат описания столбцов, и в случае, если столбец является категоричным, большинство определений категорий не определены.Я пришел с решением отправить список категориальных столбцов и категорий деловым партнерам и попросить их заполнить значения категорий.

Но может ли кто-нибудь помочь выяснить, какие из столбцов являются категоричными, поскольку я не могу сделать это вручную, потому что в нем более 20 таблиц с 70-80 столбцами в каждой?

Некоторые решения, которые я мог бы сделатьПредставьте себе:

  1. Проверка распределения.
  2. Отношение уникальных значений к общему размеру, превышающему пороговое значение, а затем числовое.

Есть ли у кого-нибудь какие-либодругие идеи?

1 Ответ

0 голосов
/ 27 февраля 2019

Учитывая, что ваш фрейм данных df, вы можете сделать:

df.dtypes

, который даст типы столбцов для вашего фрейма данных.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...