Датафрейм заменяет подчеркивание на пустой, не работает - PullRequest
0 голосов
/ 10 февраля 2019

Я изо всех сил пытаюсь понять, почему эта замена не работает

Значение входного столбца

"Глобальный многоотраслевой композитный доход (fka GITR) (USD) BWC_GMSI"

Ожидаемый результат

"Глобальный многоотраслевой композитный доход (fka GITR) (USD) BWCGMSI"

код

import pandas as pd

d = {'col1': ["Dummy", "Global Multi-Sector Income Composite(fka GITR) (USD) BWC_GMSI"], 'col2': ["dummy 3", "dummy4"]}
df = pd.DataFrame(data=d)

df2 = df.replace("_", "")

результат не изменится ....

Любые идеи, пожалуйста

1 Ответ

0 голосов
/ 10 февраля 2019

Вам необходимо regex=True:

>>> df2 = df.replace(r"_", "", regex=True)

В противном случае Pandas будет искать точные совпадения, где все содержимое ячейки - это одно подчеркивание.

Пример:

>>> d = {'col1': ["Dummy", "A_B__C_D"],
...      'col2': ["Dummy", "ABCD_"],
...      'col3': ["_", "_*_"]
...     }
>>> df = pd.DataFrame(data=d)
>>> df.replace(r"_", "", regex=True)
    col1   col2 col3
0  Dummy  Dummy     
1   ABCD   ABCD    *
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...