Использование Beautiful Soup в Python, но получение частичного исходного кода / только конечной части исходного кода - PullRequest
0 голосов
/ 30 октября 2019

Так что я новичок в BeautifulSoup, и я искал разные источники информации, чтобы узнать больше и найти решение, но я застрял. Я пытаюсь получить исходный код с этого сайта Википедии , но я получаю только часть исходного кода, только последнюю третью его часть или около того ... таким образом, я пропускаю первые 2/ 3 исходного кода. Понятия не имею, что я делаю не так. Вот код, который я использую в Python:

from bs4 import BeautifulSoup
import requests

corpus_codigo = requests.get("https://es.wiktionary.org/wiki/Wikcionario:Frecuentes-(1-1000)-Subt%C3%ADtulos_de_pel%C3%ADculas").text

corpus_soup = BeautifulSoup(corpus_codigo, features = 'lxml')

print(corpus_soup.prettify())

Я получаю только строки с 7042 по 7225 ... так что в действительности я пропускаю гораздо больше, чем 2/3 теперь, когда я вижу это подробно .. какие-нибудь предложения?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...