Разделить столбец без изменения положения строки - PullRequest
0 голосов
/ 06 ноября 2019

Я пытаюсь разделить столбец, но заметил, что разделение изменило другие значения. Например, некоторые значения строки 10 обмениваются со строкой 8. Почему это так?

Фактические данные для идентификатора 10

| vat_number | email                                            | foi_mail       | website 
|     10     | abc@test.com;example@test.com;example@test.com   | xyz@test.com   | example.com

После выполнения этой строки кода:

base_data[['email','email_1','email_2']] = pd.DataFrame(base_data.email.str.split(';').tolist(),
                                                        columns = ['email','email_1','email_2'])

base_data становится:

| vat_number | email                  | foi_mail               | website     | email_1 | email_2
|     10     | some other row value   | some other row value   | example.com | ------  | -----

До:

Before executing code that split column

После:

After executing code that split column

Данныесодержит тысячи строк, но я показал только одну строку.

Ответы [ 3 ]

0 голосов
/ 06 ноября 2019

если я понимаю дело. Я считаю, что вам нужно что-то подобное:

 base_data = base_data.merge(base_data['email'].str.split(';', expand = True).rename(columns = {0:'email',1:'email_1',2:'email_2']}), left_index = True, right_index = True)

Вот логическое объяснение:

a1 = list('abcdef')
b1 = list('fedcba')
c1 = [f'{x[0]};{x[1]}' for x in zip(a1, b1)]
df1 = pd.DataFrame({'c1':c1})
df1

Out[1]:

    c1
0   a;f
1   b;e
2   c;d
3   d;c
4   e;b
5   f;a

df1 = df1.merge(df1['c1'].str.split(';', expand = True).rename(columns = {0:'c2',1:'c3'}), left_index = True, right_index = True)
df1

Out[2]:

    c1  c2  c3
0   a;f a   f
1   b;e b   e
2   c;d c   d
3   d;c d   c
4   e;b e   b
5   f;a f   a
0 голосов
/ 06 ноября 2019

Используйте параметр expand .str.split:

import pandas as pd

# your dataframe
 vat_number                                           email      foi_mail      website
        NaN  abc@test.com;example@test.com;example@test.com  xyz@test.com  example.com

# split and expand
df[['email_1', 'email_2', 'email_3']] = df['email'].str.split(';', expand=True)

# drop `email` col
df.drop(columns='email', inplace=True)

# result
 vat_number      foi_mail      website       email_1           email_2           email_3
        NaN  xyz@test.com  example.com  abc@test.com  example@test.com  example@test.com
0 голосов
/ 06 ноября 2019

попробуйте сделать таблицу в таблице:

def test():
base_data = []
base_data.append(['12','32'])
base_data.append(['352','335'])
base_data.append(['232','32'])

print(base_data)
a = base_data[0]
print(a)
print(a[0])
print(a[1])

input("Enter to contuniue. . .")

и использовать цикл для добавления

...