Функция разделения не работает для строки и списка - PullRequest
0 голосов
/ 30 апреля 2020

Просто делаю одну из моих первых операций по просмотру веб-страниц, и у меня уже есть элементы, которые я хотел бы извлечь, но я не могу найти функцию для их печати в виде нумерованного списка. Код, который у меня есть на данный момент:

r = requests.get('https://mmazurek.dev/category/programowanie-2/page/3/', proxies={'http':'82.119.170.106'})

page = soup(r.content, "html.parser")

contents=page.findAll(None, class_="post-title-link")

for content in contents:
    text_content=list(content.get_text())
    first_letter=str(text_content[0])
    x="".join(first_letter)  

    listToStr = "".join(map(str, text_content))

    print(listToStr)

Цель состоит в том, чтобы распечатать список как:

  1. P ....
  2. J ...
  3. ...

Надеюсь, вы не возражаете, что это текст Poli sh;)

1 Ответ

1 голос
/ 30 апреля 2020
def get_html(url, useragent=None, proxy=None):
    session = requests.Session()
    request = session.get(url=url, headers=useragent, proxies=proxy)
    if request.status_code == 200:
        soup = bs(request.text, 'lxml')
        return soup
    else:
        print("Error " + str(request.status_code))
        return request.status_code


def parse(soup):
    data = []
    contents = soup.findAll(None, class_="post-title-link")
    for i, content in enumerate(contents):
        text = content.text
        href = content['href']
        data.append([
            i,
            text,
            href,
        ])

    return data

    return data

data = parse(get_html('https://mmazurek.dev/category/programowanie-2/page/3/', proxy={'http': '82.119.170.106'}))

print(data)
...