Как я могу разделить значения в столбце согласно изображению, приложенному с пробелами в pandas - python - PullRequest
0 голосов
/ 22 января 2020

У меня есть набор данных с необработанными данными в файле в формате .txt, множество значений в одном столбце.

Я хотел бы разделить 6 значений, отдельные разделить на отдельные столбцы.

index
0     1 1 
1     2
2     3 2 2 4 2 2 2 3 3 (single column)
3     5
4     1
5     6
6     6 7 7 7 6 6 8 8 8 8 (single column)

1 Ответ

0 голосов
/ 22 января 2020

Вы можете использовать str.split() метод серии (столбца), чтобы разбить строку на несколько слов, возможно превратив их в отдельные столбцы.

Вы можете использовать что-то вроде:

df = series.str.split(expand=True)

Или, предполагая, что они находятся в столбце с именем «значения» (вы, кажется, не упоминаете имя столбца и не уверены, как читаете файл .txt):

df = df["values"].str.split(expand=True)

Ваши столбцы будут иметь имена с номерами, начинающимися с 0.

Ваши данные в столбцах будут по-прежнему храниться в виде строк. Если вы хотите, вы можете затем преобразовать их в целые числа (или числа с плавающей запятой), хотя если вы хотите, чтобы целые числа, вам, вероятно, понадобилось бы обрабатывать пропущенные значения в столбцах, заменив их на значение Sentinel, например 0 или -1.

Например, чтобы использовать целые числа и установить 0 для столбцов без значения:

df = df.fillna(0).astype(int)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...