У меня есть фрейм данных, в котором есть столбец с текстовыми данными. Я хочу удалить все ссылки URL из текстовых данных.
Например, столбец df выглядит так:
user_id post_title
1 #hello....world!!https://www.facebook.com
2 https://www.google.com
3 https://www.facebook.com
Я пытался сделать это, но я получаю сообщение об ошибке 'str' объект не может быть интерпретирован как целое число. Как это исправить?
def replaceURL(post_title):
post_title = post_title.map(lambda x: re.sub('((www\.[^\s]+)|(https?://[^\s]+))','',str(x)))
post_title = post_title.str.strip()
post_title = post_title.map(lambda x: re.sub(r'#([^\s]+)', r'\1','',str(x)))
return post_title
df['post_title'] = replaceURL(df['post_title'])
df['post_title_length'] = df['post_title'].str.len()
df
Вывод должен содержать пустые значения вместо ссылок URL:
user_id post_title
1 #hello....world!!
2
3