Мне дали мега CSV-файл для анализа.Он содержит столбцы общих типов данных, например
- имя (строка),
- оценка (числовая),
- дата (время) начала,
- комментариев (строка),
- домашняя страница (ссылка),
- фотография (ссылка),
- адрес (строка)
- почтовый индекс (числовой)...
Поскольку столбцов очень много (3000+), я не могу установить тип данных столбцов вручную.Я думаю прочитать весь столбец и определить его тип, угадав тип x
из str(x)
.Я знаю, что могу написать некоторую систему, основанную на правилах, чтобы справиться с этой проблемой, но я думаю, что это некоторая распространенная проблема, которая могла бы быть хорошо решена.Кто-нибудь знает какой-либо инструмент для выполнения работы?
Кроме того, есть ли инструмент, который может обеспечить даже более мелкие типы.Например, почтовый индекс и оценка должны быть двух разных числовых типов, а имя и комментарии должны быть двух разных типов строк.