Я создаю приложение, использующее python, которое включает получение новостных статей из RSS-каналов. Как часть моего проекта, я решил использовать шаблон, чтобы извлечь только содержимое статьи со страницы HTML, на которой эта статья появляется.
Хотя кипятильник изначально был написан для Java, он также был портирован на python. Вы можете увидеть его страницу на github здесь: https://github.com/misja/python-boilerpipe
Проблема в том, что я получаю исключение при попытке импортировать его, используя:
from boilerpipe.extract import Extractor
Я получаю ошибку:
Traceback (most recent call last):
File "", line 1, in
File "build\bdist.win32\egg\boilerpipe\extract__init__.py", line 12, in
File "C:\Python26\lib\site-packages\jpype_jclass.py", line 54, in JClass
raise _RUNTIMEEXCEPTION.PYEXC("Class %s not found" % name)
jpype._jexception.ExceptionPyRaisable: java.lang.Exception: Class
de.l3s.boilerpipe.sax.HTMLHighlighter not found
Что может быть причиной этой проблемы и как я могу ее исправить?