Заменить указанные c китайских слов в каждой строке фрейма данных - PullRequest
2 голосов
/ 28 мая 2020

Я пытаюсь разбить длинную строку китайских символов, но когда я пытаюсь заменить «заголовки» каждого столбца, python не выполняет замену:

data= pd.DataFrame({'DETAILS': ['厂名: 进口地扪玉米粒 厂址: 进口地扪玉米粒 厂家联系方式: 02081977626 配料.', '厂名: Hill View Packing Co. 厂址: 美国地们 厂家联系方式: 0', '厂名: 5 厂址: 5 厂家联系方式: 5 配料表: 5 储藏方法: 常温 保质期']
                       })
data.DETAILS.replace(['厂名:','厂址:'],'$',inplace=True)

Ответы [ 2 ]

2 голосов
/ 28 мая 2020

Давайте попробуем добавить regex=True, Из документа:

to_replacestr, regex, list, dict, Series, int, float или None

data.DETAILS=data.DETAILS.replace(['厂名:','厂址:'],'$',regex=True)
Out[495]: 
0    $ 进口地扪玉米粒 $ 进口地扪玉米粒 厂家联系方式: 02081977626 配料.
1       $ Hill View Packing Co. $ 美国地们 厂家联系方式: 0
2          $ 5 $ 5 厂家联系方式: 5 配料表: 5 储藏方法: 常温 保质期
Name: DETAILS, dtype: object
1 голос
/ 28 мая 2020

Я бы заменил регулярное выражение:

 lst = ['厂名:','厂址:']

 data['DETAILS'] = data.DETAILS.replace('|'.join(lst), '$', regex=True)

Вывод:

                                       DETAILS
0  $ 进口地扪玉米粒 $ 进口地扪玉米粒 厂家联系方式: 02081977626 配料.
1     $ Hill View Packing Co. $ 美国地们 厂家联系方式: 0
2        $ 5 $ 5 厂家联系方式: 5 配料表: 5 储藏方法: 常温 保质期
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...