В настоящее время меня интересуют типы данных ...
Они не существуют в файле CSV.Данные только строки.Только.Ничего больше.
проверить образец строк
Ничего не говорит вам, кроме того, что вы видели в образце.Следующая строка после вашей выборки может быть строкой, которая выглядит совершенно иначе, чем строки выборки.
Единственный способ обработки файлов CSV - это написание приложений обработки CSV, которые предполагают конкретные типы данных и пытаются выполнить преобразование.Вы не можете "узнать" много о файле CSV.
Если столбец 1 должен быть датой, вам придется посмотреть на строку и определить формат.Это может быть что угодно.Число, типичная григорианская дата в американском или европейском формате (нет способа узнать, является ли 1/1/10 американским или европейским).
try:
x= datetime.datetime.strptime( row[0], some format )
except ValueError:
# column is not valid.
Если столбец 2 должен быть плавающим, выможет только это сделать.
try:
y= float( row[1] )
except ValueError:
# column is not valid.
Если столбец 3 должен быть целым числом, вы можете сделать это только.
try:
z= int( row[2] )
except ValueError:
# column is not valid.
Нет способа "обнаружить", если CSVимеет строки с плавающей запятой, за исключением выполнения float
в каждой строке.Если строка не удалась, кто-то неправильно подготовил файл.
Поскольку вам нужно выполнить преобразование, чтобы увидеть, возможно ли преобразование, вы можете просто обработать строку.Это проще и дает вам результаты за один проход.
Не тратьте время на анализ данных.Спросите людей, которые его создали, что там должно быть 1030 *.