У меня есть файл, содержащий строки, числа с плавающей точкой и целые числа. Десятичные дроби - это запятые, а также разделитель / разделитель. Поплавки могут быть «нормальными», но также академическими (например, 192967e-009). Нормальные имеют четыре пробела впереди (0,797739).
пример строки: 2, мужчина, 0,879876, 0,120124,7,55166e-010,3,03629e-008,1,06476e-007,3,68805e-019,1
Импорт в пандах приводит к странным результатам, потому что панды не могут различить разделитель и десятичную дробь и добавляет еще несколько столбцов, которых не существует.
Я прочитал руководство по read_csv и попробовал его с регулярным выражением, но не смог решить проблему.
Я также попробовал следующее: Как .читать файл с "," (запятая) какразделитель, который разделяет десятичные числа, разделенные "," (запятая) '? в сочетании с циклом for, но он не работает для меня.
import pandas as pd
import csv
import re
path = open("path\Cluster.txt", "r") #extra loading because of a long path with vowel mutation
LCA_data = csv.reader(path)
df = pd.read_csv(path, header=0, sep=',', decimal=',')
df.head()
Я ожидаю табличнуюдатафрейм, но pandas добавляет еще несколько столбцов, потому что они разделяются на каждую запятую.