Question

Я создаю приложение, использующее python, которое включает получение новостных статей из RSS-каналов. Как часть моего проекта, я решил использовать шаблон, чтобы извлечь только содержимое статьи со страницы HTML, на которой эта статья появляется.

Хотя кипятильник изначально был написан для Java, он также был портирован на python. Вы можете увидеть его страницу на github здесь: https://github.com/misja/python-boilerpipe

Проблема в том, что я получаю исключение при попытке импортировать его, используя:

from boilerpipe.extract import Extractor

Я получаю ошибку:

Traceback (most recent call last):
File "", line 1, in
File "build\bdist.win32\egg\boilerpipe\extract__init__.py", line 12, in
File "C:\Python26\lib\site-packages\jpype_jclass.py", line 54, in JClass
raise _RUNTIMEEXCEPTION.PYEXC("Class %s not found" % name)
jpype._jexception.ExceptionPyRaisable: java.lang.Exception: Class 
de.l3s.boilerpipe.sax.HTMLHighlighter not found

Что может быть причиной этой проблемы и как я могу ее исправить?

asmaier · Answer 1 · 09 марта 2015

Это сработало для меня в Mac OS X 10.8.5 с Python 2.7.9.:

pip install JPype1    # to install https://pypi.python.org/pypi/JPype1
pip install charade
git clone https://github.com/misja/python-boilerpipe.git
cd python-boilerpipe
sudo python setup.py install

Тогда вы сможете сделать это в консоли python

>>> from boilerpipe.extract import Extractor
>>> extractor = Extractor(extractor='ArticleExtractor', url="http://en.wikipedia.org/wiki/Main_Page")
>>> print extractor.getText()

phillipwei · Answer 2 · 21 октября 2014

Лучше всего для меня:

git clone https://github.com/misja/python-boilerpipe.git
cd python-boilerpipe
sudo python setup.py install

Возможно, вам придется:

установить JPype (sudo apt-get установить python-jpype в Ubuntu)
установить шараду (sudo pip установить шараду)

Но вам не нужно будет устанавливать банку JAVA для котельной трубы, так как программа установки загружает ее для вас.

Я пытался установить котельную трубу Python из pip, но безуспешно. Я успешно выполнял стандартный Java-код, но продолжал получать ту же ошибку.

Mutant · Answer 3 · 15 сентября 2012

Вам не хватает java-пакетов котельной установки, вы можете найти их здесь - http://code.google.com/p/boilerpipe/downloads/list

у вас установлена только оболочка Python для котельной трубы.

Taposh DuttaRoy · Answer 4 · 17 февраля 2014

У меня была такая же проблема.Я видел подробности настройки, предоставленные автором Mining the web.Вот ссылка на его страницу Github для котельной трубы

https://github.com/misja/python-boilerpipe/blob/master/setup.py

beerbajay · Answer 5 · 19 февраля 2012

Класс HTMLHighlighter не найден.Вы установили свой JAVA_HOME? Документация гласит:

Обязательно правильно установите JAVA_HOME, поскольку jpype зависит от этого параметра.

Проблемы с импортом котла в Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 5 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Проблемы с импортом котла в Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 5 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы