Разбить строку, имеющую несколько значений в ячейке и добавить обратно в список данных - PullRequest
0 голосов
/ 02 октября 2018

enter image description here

У меня есть этот кадр данных, в котором некоторые значения в Postcode могут иметь более одного почтового индекса.Я пытаюсь разделить строку, содержащую несколько почтовых индексов, и затем добавить обратно в фрейм данных.

Я уже получаю список индексов с несколькими почтовыми индексами, используя следующий код:

index_list = df_selangor[df_selangor['Postcode'].str.contains(' ')].index

Это позволяет мне создать новый фрейм данных и затем разделить значение на Postcode следующим образом;

df_selangor_split = df_selangor.copy()
df_selangor_split = df_selangor_split[df_selangor_split.index.isin(index_list)]
df_selangor_split['Postcode'] = df_selangor_split['Postcode'].str.split()

enter image description here

Однако я застрял послеэтот шаг.Я не уверен, как разделить его еще раз, чтобы скопировать Area и иметь только 1 почтовый индекс.

1 Ответ

0 голосов
/ 02 октября 2018
pd.concat([pd.Series(row['Area'], row['Postcode'].split(','))
         for _, row in dfx.iterrows()])

По сути, мы перебираем каждую строку и разделяем столбец почтового индекса для каждой области, а затем объединяем ее.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...