Панды не будут разделять столбцы в моем файле .txt, разделенном запятыми - PullRequest
0 голосов
/ 27 августа 2018

Я знаю, что об этом спрашивали много раз, но это заставило меня почесать голову.У меня есть файл .txt, который выглядит следующим образом:

"0,1,2,3,4, .... 63,0,1,2,3,4 ..... 63"

"0,1,2,3,4, .... 63,0,1,2,3,4 ..... 63"

"0,1,2, 3,4, .... 63,0,1,2,3,4 ..... 63 "

и т. Д. Для нескольких строк.Так что это 64 + 64 = 128 столбцов, разделенных запятыми, в то время как каждая строка заключена в двойные кавычки.

Я использовал команды:

#Used this initially
df = pd.read_csv('test_data.txt')
#Used this after reading more stackoverflow answers
df = pd.read_csv('test_data.txt', header = None, sep=",", delimiter=',', quotechar='"', index_col = None)

Я знаю, что sep и разделитель одинаковыпараметры, но я все равно попробовал оба, мне не нужно было их указывать, потому что pandas выбирает запятые по умолчанию.После этого я просто использую:

df.head()

И выводит:

                                                 0
0   0.00,1.00,2.00,3.00,4.00,5.00,6.00,7.00,8.00,9...

1   0.00,1.00,2.00,3.00,4.00,5.00,6.00,7.00,8.00,9...

2   0.00,1.00,2.00,3.00,4.00,5.00,6.00,7.00,8.00,9...

3   0.00,1.00,2.00,3.00,4.00,5.00,6.00,7.00,8.00,9...

4   0.00,1.00,2.00,3.00,4.00,5.00,6.00,7.00,8.00,9...

Он просто читает все как один столбец, пожалуйста, посоветуйте, как я могу прочитать все 128 столбцов.

1 Ответ

0 голосов
/ 27 августа 2018

Это приведет вас к желаемому результату:

df = pd.read_csv('test_data.txt', header=None)
df = pd.DataFrame(df[0].str.split(',').tolist())

Таким образом, это прочитает ваш файл, в котором каждая строка обернута кавычками, и упакует его в один столбец.

ЗатемВы разделяете этот столбец на comma и создаете новый фрейм данных из результатов.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...