Я пытался удалить некоторые данные из файлов HTML. У меня есть закодированная логика, чтобы получить правильные клетки. Сейчас я изо всех сил пытаюсь получить фактическое содержимое ячейки:
вот мой htm snip
headerRows [0] [10] .contents
[<font size="+0"><font face="serif" size="1"><b>Apples Produced</b><font size="3">
</font></font></font>]
Обратите внимание, что это элемент списка из Python [].
Мне нужно значение произведенных яблок, но я не могу его получить.
Буду признателен за любые предложения
Предложения о хорошей книге, объясняющие это, заработают мою вечную благодарность
Спасибо за этот ответ. Однако, нет более общего ответа. Что произойдет, если в моей ячейке нет жирного атрибута
скажем, что это:
[<font size="+0"><font face="serif" size="1"><I>Apples Produced</I><font size="3">
</font></font></font>]
Произведено яблок
Я пытаюсь научиться читать / понимать документацию, и ваш ответ поможет
Я действительно ценю эту помощь. Лучшая вещь об этих ответах состоит в том, что обобщать их намного проще, чем я мог сделать из документации BeautifulSoup. Я научился программировать в эпоху Фортрана, и пока я наслаждаюсь изучением питона, я в восторге от его силы - пример BeautifulSoup. мне сложно сделать всю документацию.
Приветствия