соответствующий код; barfs при создании экземпляра SAXSource
:
TransformerFactory factory = TransformerFactory.newInstance();
XMLReader xmlReader = XMLReaderFactory.createXMLReader("org.ccil.cowan.tagsoup.Parser");
Source input = new SAXSource(xmlReader, "http://books.toscrape.com/");
Result output = new StreamResult(System.out);
factory.newTransformer().transform(input, output);
JavaDoc's скажем :
public SAXSource(XMLReader reader,
InputSource inputSource)
Создайте SAXSource, используя XMLReader и SAX InputSource.
Transformer или SAXTransformerFactory установят себя как
считыватель ContentHandler, а затем вызовет reader.parse (inputSource).
Глядя на InputSource
показывает:
InputSource(InputStream byteStream)
Create a new input source with a byte stream.
InputSource(Reader characterStream)
Create a new input source with a character stream.
Таким образом, для примера потребуется поток символов для чтения в html
для InputStream
??
Будет ли tagsoup
лучше использоваться для этого преобразования личности? Но как?