Импортируйте данные из .txt, где разделитель / разделитель и десятичный разделитель - запятые в пандах - PullRequest
0 голосов
/ 01 октября 2019

У меня есть файл, содержащий строки, числа с плавающей точкой и целые числа. Десятичные дроби - это запятые, а также разделитель / разделитель. Поплавки могут быть «нормальными», но также академическими (например, 192967e-009). Нормальные имеют четыре пробела впереди (0,797739).

пример строки: 2, мужчина, 0,879876, 0,120124,7,55166e-010,3,03629e-008,1,06476e-007,3,68805e-019,1

Импорт в пандах приводит к странным результатам, потому что панды не могут различить разделитель и десятичную дробь и добавляет еще несколько столбцов, которых не существует.

Я прочитал руководство по read_csv и попробовал его с регулярным выражением, но не смог решить проблему.

Я также попробовал следующее: Как .читать файл с "," (запятая) какразделитель, который разделяет десятичные числа, разделенные "," (запятая) '? в сочетании с циклом for, но он не работает для меня.

import pandas as pd
import csv
import re

path = open("path\Cluster.txt", "r") #extra loading because of a long path with vowel mutation
LCA_data = csv.reader(path)
df = pd.read_csv(path, header=0, sep=',', decimal=',')
df.head()

Я ожидаю табличнуюдатафрейм, но pandas добавляет еще несколько столбцов, потому что они разделяются на каждую запятую.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...