Как преобразовать очищенные данные в список для работы с - PullRequest
0 голосов
/ 24 июня 2019

Я работаю над кодом, который собирает данные с сайтов, таких как визг. Когда я извлекаю данные в текстовую печать (data.text), все работает хорошо. Но когда я пытаюсь преобразовать его в список, у меня возникают проблемы.

Я пытался закодировать его или добавить str в начале, и я попытался создать список, чтобы добавить все внутри. но выводит «Нет».

import requests
from bs4 import BeautifulSoup


def third_site_fc(third_site_franche_comte = requests.get("https://www.paruvendu.fr/a/utilitaire-occasion/tracteur-routier/")):

    third_soup_fc = BeautifulSoup(third_site_franche_comte.text,'html.parser')
    list = []
    for articles_third_site in third_soup_fc.find_all('div',class_='ergov3-txtannonce'):
        print(articles_third_site.text in list)

print(third_site_fc())

Я получаю этот вывод:

output:False
False
False
False
False
False
False
False
False
False
False
False
False
False
False
False
None

Я ожидал список, содержащий всю информацию из цикла (не символ за символом). Что-то вроде

['abababababababab ababa ababababaab']

Спасибо за вашу помощь и понимание!

1 Ответ

0 голосов
/ 24 июня 2019

Вы хотели это сделать?

def third_site_fc(third_site_franche_comte = requests.get("https://www.paruvendu.fr/a/utilitaire-occasion/tracteur-routier/")):

    third_soup_fc = BeautifulSoup(third_site_franche_comte.text,'html.parser')

    my_list = [] # Try to avoid reserved keywords
    for articles_third_site in third_soup_fc.find_all('div',class_='ergov3-txtannonce'):
        text = (articles_third_site.text
                  .replace('\n','')
                  .replace('\r',''))
        my_list.append(text)

    return my_list

print(third_site_fc())
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...