getText () против text () против get_text () - PullRequest
0 голосов
/ 30 августа 2018

У меня есть фрагмент html, извлеченный с помощью bs4, как показано ниже

<div class="a-section a-spacing-small" id="productDescription">
<!-- show up to 2 reviews by default -->
<p>Satin Smooth Universal Protective Wax Pot Collars by Satin Smooth</p>
</div>

Для извлечения текста я использовал text.strip ()

output.text()

Это дало мне вывод "TypeError: 'str' object is not callable"

Пока я использовал output.get_text() и output.getText(), я получил нужный текст

В чем различия между этими 3? почему get_text () и getText () дают одинаковый вывод?

1 Ответ

0 голосов
/ 30 августа 2018

Они очень похожи:

  • .get_text - это функция, которая возвращает текст тега в виде строки
  • .text - это свойство, которое вызывает get_text (поэтому оно идентично, за исключением того, что вы не используете паразиты)
  • .getText - псевдоним get_text

Я бы использовал .text, когда это возможно, и .get_text(...), когда вам нужно передать пользовательские аргументы (например, foo.get_text(strip=True, seperator='\n')).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...