Python заменить текст BeautifulSoup - PullRequest
0 голосов
/ 05 февраля 2020

У меня проблема с этим битом python. Это работает, но если какие-либо данные содержат запятую, это, очевидно, портит мой CSV.

import requests
import sys
from bs4 import BeautifulSoup

url = requests.get(sys.argv[1])

html = BeautifulSoup(url.content,'html.parser')

for br in html.find_all("br"):
    br.replace_with(" ")

for tr in html.find_all('tr'):
    data = []   

    for td in tr.find_all('td'):
        data.append(td.text.strip())

    if data:
        print("{}".format(','.join(data)))

Можно ли заменить запятые пробелами?

Пример из ...

column 1    column 2    column,3    column 4

To ...

column 1,column 2,column 3,column 4

В настоящий момент я понимаю, что вызывает проблемы ...

column 1,column 2,column,3,column 4

1 Ответ

0 голосов
/ 05 февраля 2020

Попробуйте data.append(td.text.strip().replace(',', ' ')

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...