Я ищу ответ как это, но в python.Как выполнить предварительную обработку текста в нескольких столбцах?У меня есть два текстовых столбца см. скриншоты .Чтобы сделать уборку, я должен сделать дважды для каждого столбца (см. Мой код).Есть ли какой-нибудь умный способ сделать подобную задачу?Спасибо!
import requests
from bs4 import BeautifulSoup #html.parser'
df['Summary'] = [BeautifulSoup(text).get_text() for text in df['Summary']]
df['Text'] = [BeautifulSoup(text).get_text() for text in df['Text']]
df.loc[:,"Text"] = df.Text.apply(lambda x : str.lower(x))
df.loc[:,"Summary"] = df.Summary.apply(lambda x : str.lower(x))
#remove punctuation.
df["Text"] = df['Text'].str.replace('[^\w\s]','')
df["Summary"] = df['Summary'].str.replace('[^\w\s]','')