Функция len () не дает правильный номер символа - PullRequest
0 голосов
/ 25 апреля 2018

Я пытаюсь выяснить количество символов в строке, но по какой-то странной причине len () возвращает мне только 1. вот пример моего вывода

WearWorks is a haptics design company that develops products and 
experiences that communicate information through touch. Our first product, 
Wayband, is a wearable tactile navigation device for the blind and visually 
impaired.
True
1

вот мой код

import requests
from bs4 import BeautifulSoup
from urllib.parse import urljoin

url="https://www.wear.works/"
response=requests.get(url)
html=response.content
soup=BeautifulSoup(html,'html.parser')

#reference /300665/izvlechenie-teksta-iz-faila-html-s-ispolzovaniem-python
# getting rid of the script sytle in html
for script in soup(["script", "style"]):
    (script.extract())    # rip it out
    # print(script)

# get text
# grabbing the first chunk of text
text = soup.get_text()[0]
print(isinstance(text, str))
print(len(text))

print(text)

1 Ответ

0 голосов
/ 25 апреля 2018

Проблема в text = soup.get_text()[0] преобразовать его в text = soup.get_text() посмотрите.Вы нарезаете строку, чтобы получить первый символ.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...