Я думаю, что есть проблема, когда теги 'div' слишком сильно вложены. Я пытаюсь проанализировать некоторые контакты из HTML-файла facebook, и Beautifulsoup не может найти теги "div" с классом "fcontent".
Это происходит и с другими классами. Когда я ищу div в общем, получаются только те, которые не так много вложены.
Исходным кодом html может быть любая страница из facebook в списке друзей вашего друга (не одного из ваших друзей). Если кто-то может это проверить и дать совет, я был бы очень признателен.
Это мой код, где я просто пытаюсь напечатать количество тегов "div" с классом "fcontent":
from BeautifulSoup import BeautifulSoup
f = open('/Users/myUserName/Desktop/contacts.html')
soup = BeautifulSoup(f)
list = soup.findAll('div', attrs={'class':'fcontent'})
print len(list)