Как прочитать текстовый файл, прочитанный во фрейме данных с функцией разделения? - PullRequest
0 голосов
/ 25 января 2020

У меня есть эти данные в файле Excel. Я хочу сохранить данные, которые имеют только длину 6, удалить остаток и экспортировать их в разделении отдельных значений, хранящихся в отдельном столбце.

Скажите, пожалуйста, есть ли у нас какая-либо функция для разделения чисел c значения в файле, чтобы прочитать его и разделить

1 Ответ

2 голосов
/ 25 января 2020

Судя по вашим общим данным, между цифрами есть пробелы, поэтому они уже будут в str

. Попробуйте следующий код:

ваш df выглядит следующим образом:

    a
0   11
1   2
2   3 2 4 
3   5
4   1
5   6
6   1 1
7   6
8   6 7 7 7 6 6 8 8 8
9   6 8 7 9 5 2 1 44 6 55
10  6 8 7 9 5 2 1 44 6 55 4 4 4 4

фильтрует строки с len, равным 6

df=df[df['a'].str.len()==6]

, затем разделяет их, используя split() метод, подобный этому

df['a'].str.split(" ", expand = True)

вывод:

    0   1   2   3
2   3   2   4   

РЕДАКТИРОВАТЬ:

из-за проблем с памятью при чтении большого файла вы можете обратиться к этой записи SO ИЛИ прочитать файл порциями и добавить / сохранить вывод в новый файл

reader = pd.read_csv(filePath,chunksize=1000000,low_memory=False,header=0)
...