Судя по вашим общим данным, между цифрами есть пробелы, поэтому они уже будут в str
. Попробуйте следующий код:
ваш df
выглядит следующим образом:
a
0 11
1 2
2 3 2 4
3 5
4 1
5 6
6 1 1
7 6
8 6 7 7 7 6 6 8 8 8
9 6 8 7 9 5 2 1 44 6 55
10 6 8 7 9 5 2 1 44 6 55 4 4 4 4
фильтрует строки с len
, равным 6
df=df[df['a'].str.len()==6]
, затем разделяет их, используя split()
метод, подобный этому
df['a'].str.split(" ", expand = True)
вывод:
0 1 2 3
2 3 2 4
РЕДАКТИРОВАТЬ:
из-за проблем с памятью при чтении большого файла вы можете обратиться к этой записи SO ИЛИ прочитать файл порциями и добавить / сохранить вывод в новый файл
reader = pd.read_csv(filePath,chunksize=1000000,low_memory=False,header=0)