все. У меня есть быстрый вопрос о BeautifulSoup с Python. У меня есть несколько фрагментов HTML,...
Пока этот код работает довольно быстро: for olay in soup("li",...
У меня есть приведенный ниже (упрощенный) код, который использует следующий источник: <html>...
Насколько я понимаю, регулярное выражение - это подход бедного человека к работе с Beautifulsoup,...
from BeautifulSoup import BeautifulSoup import urllib2 import re user = raw_input('begin here!:...
Я работаю с Python 3.x Я хочу извлечь текст из нескольких веб-страниц.Что такое хорошая библиотека,...
Я могу разобрать файл, который выглядит так: <a href="http://www.youtube.com/watch
У меня простая потребность. Я просто хочу узнать все теги из HTML-источника, который не имеет тип...
все. У меня проблемы с получением ссылок во вложенном HTML с помощью Mechanize в Python. Вот мой...
У меня есть HTML следующим образом: html = '<html><table>this is a...
Я пытаюсь взять данные данного дня из этого расписания: нажмите здесь Мне удалось использовать...
Я (очень) новичок в BeautifulSoup и последние три дня пытаюсь получить список церквей из http://www
Я пытался написать небольшой скребок на Python, используя BeautifulSoup.Все идет гладко, пока я не...
Я пытаюсь вычеркнуть речь с сайта, используя BeautifulSoup.Однако я сталкиваюсь с проблемами,...
<font class="detDesc">Uploaded 10-29 18:50, Size 4.36 GiB, ULed by...
Я использую Selenium webdriver в Python для проекта очистки веб-страниц. Как распечатать HTML-текст...
Я использую Selenium webdriver в Python для проекта очистки веб-страниц. Я хотел бы войти в систему...
for imgsrc in Soup.findAll('img', {'class': 'sizedProdImage'}): if...
Когда я посылаю некоторые данные на хост: r = urllib2.Request(url, data = data, headers = headers)...
desc = re.compile('<ul class="descShort bullet">(.*)</ul>', re
Я новичок в BeautifulSoup и просмотрел онлайн-документы, но не смог найти то, что мне было нужно,...
Я пытаюсь почистить статьи из базы данных китайских газет. Вот часть исходного кода (вставка...
Я пытаюсь извлечь текст из вложенных тегов, например, xml имеет вид: <thread id = 1_1>...
Из RSS-канала, как получить строку всего, что находится внутри каждого тега item ? Пример ввода...
Есть ли способ написать это в BeautifulSoup? for node in soup: if node is in ["a",...