Я пытаюсь создать файл PDF из документа HTML.
Хорошо, HTML-файл правильно сформирован и без ошибок. Я использовал HtmlCleaner для очистки кода, поэтому он подходит для создания PDF-файлов с помощью iText.
Это мой код, который я использовал с примером HTML.
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.StringReader;
import java.io.UnsupportedEncodingException;
import com.itextpdf.text.DocumentException;
import com.itextpdf.text.PageSize;
import com.itextpdf.text.html.simpleparser.HTMLWorker;
import com.itextpdf.text.pdf.PdfWriter;
public class pdfIng {
/**
* @param args
*/
public static void main(String[] args) {
// TODO Auto-generated method stub
try {
com.itextpdf.text.Document document = new com.itextpdf.text.Document(PageSize.A4);
PdfWriter pdfWriter = PdfWriter.getInstance(document, new FileOutputStream("D://testpdf.pdf"));
document.open();
document.addAuthor("Author of the Doc");
document.addCreator("Creator of the Doc");
document.addSubject("Subject of the Doc");
document.addCreationDate();
document.addTitle("This is the title");
//SAXParser parser = SAXParserFactory.newInstance().newSAXParser();
//SAXmyHtmlHandler shh = new SAXmyHtmlHandler(document);
HTMLWorker htmlWorker = new HTMLWorker(document);
String str = "<?xml version=\"1.0\" encoding=\"utf-8\"?>"+ " <html> <head /> <body> " +
"<h2>Text</h2> " +
" Here, you will learn how to retrieve all rows from a " +
"database table. You know that table contains the data in " +
"rows and columns format. If you want to access the data from" +
" a table then you need to use some APIs and methods. See brief " +
"descriptions for retrieving all rows from a database table as below: " +
" Description of program: Program establishes the connection " +
"between MySQL database and java file so that the we can retrieve " +
"all data from a specific database table. If any exception occurs " +
"then shows a message SQL code does not execute. " +
"<br /> <br /> <hr /> <br /> " +
"<b>Name</b> " +
"AAAAAA AAAAAAAAA <br /> <b>Date :" +
"</b> 17/04/2011 00:31:18 <br /> <b>Text:" +
"</b> <br /> gggggggggggggg <br /> <br /> " +
" <br /> " +
"<br /> <b>Name</b> " +
" BBBBBB BBBBBBBBB <br /> <b>Date " +
":</b> 17/04/2011 00:35:37 <br /> <b>Text:</b>" +
" <br /> gftgfgfgfgfgggfgf gggggg" +
" <br /> <br /> " +
" <br /> <br /> <b>Name</b> " +
"DDDDDD DDDDDDDDD <br /> <b>Date :</b> " +
" 16/04/2011 22:28:28 <br /> <b>Text:</b> " +
"<br /> w tawa! <br /> <br /> " +
" <br /> <br /> <b>Name</b> " +
"CCCCCC CCCCCCCCC <br /> <b>Date :</b> " +
"16/04/2011 22:37:08 <br /> <b>Text:</b> " +
"<br /> ched tawa!!! <br /> <br /> " +
" <br /> " +
" <br /> <b>Name</b> " +
"BBBBBB BBBBBBBBB <br /> <b>Date :</b> " +
" 16/04/2011 22:37:26 <br /> <b>Text:</b> " +
"<br /> okiiiiii! <br /> <br /> " +
" " +
" <br /> <br /> <b>Name</b> " +
" AAAAAA AAAAAAAAA <br /> <b>Date :</b> " +
" 17/04/2011 02:41:14 <br /> <b>Text:</b> " +
" <br /> cava hakka?? " +
" <br /> <br /> " +
" <br /> </body></html> ";
System.out.println(str);
htmlWorker.parse(new StringReader(str));
document.close();
} catch(DocumentException e) {
e.printStackTrace();
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}
}
и вывод
Exception in thread "main" java.lang.NullPointerException
at com.itextpdf.text.html.simpleparser.HTMLWorker.createLineSeparator(HTMLWorker.java:435)
at com.itextpdf.text.html.simpleparser.HTMLTagProcessors$5.startElement(HTMLTagProcessors.java:208)
at com.itextpdf.text.html.simpleparser.HTMLWorker.startElement(HTMLWorker.java:189)
at com.itextpdf.text.xml.simpleparser.SimpleXMLParser.processTag(SimpleXMLParser.java:566)
at com.itextpdf.text.xml.simpleparser.SimpleXMLParser.go(SimpleXMLParser.java:340)
at com.itextpdf.text.xml.simpleparser.SimpleXMLParser.parse(SimpleXMLParser.java:592)
at com.itextpdf.text.html.simpleparser.HTMLWorker.parse(HTMLWorker.java:143)
at pdfIng.main(pdfIng.java:78)
Сначала я подумал, что эта строка "<?xml version=\"1.0\" encoding=\"utf-8\"?>"
вызывает ошибку, но это не так.
Я искал в строке Str, есть ли символ, который вызывает ошибку, но все слова кажутся мне нормальными и здоровыми, и я не могу ни одного устранить.
Заранее спасибо за помощь! :)