Удалить буквы в слове в столбце pandas, если слово следует заданному шаблону c - PullRequest
0 голосов
/ 12 февраля 2020

Я использовал API для загрузки информации, связанной с компаниями и темами. К сожалению, некоторые из названий тем / компаний были загружены с буквой b в начале и в конце. Я не хочу заменять их одно за другим, и я ищу регулярное выражение, которое может помочь мне определить все подстроки, начинающиеся и заканчивающиеся буквой «b», и удалить букву «b».

news = {'Text':['bNikeb invests in shoes', 'bAdidasb invests in t-shirts', 'dog drank water'], 'Source':['NYT', 'WP', 'Guardian']}
news_df = pd.DataFrame(news)


outcome = {'Text':['Nike invests in shoes', 'Adidas invests in t-shirts', 'dog drank water'], 'Source':['NYT', 'WP', 'Guardian']}
outcome_df = pd.DataFrame(news)

Спасибо!

1 Ответ

3 голосов
/ 12 февраля 2020

Как насчет попробовать этот шаблон

news_df.Text.str.replace(r'\bb(\w+)b\b', r'\1')

Out[1054]:
0         Nike invests in shoes
1    Adidas invests in t-shirts
2               dog drank water
Name: Text, dtype: object
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...