Запись Emoji в XML файл в JAVA - PullRequest
1 голос
/ 06 января 2020

Короткий вопрос: при выводе String str = "?"; файла XML, содержащего <tag>?</tag> вместо <tag>&#128557;</tag>

Я пытаюсь создать файл XML в JAVA, который может содержать обычный текст или эмодзи внутри тега. Файл XML в кодировке UTF-8, поэтому при открытии в Notepad ++ вы можете видеть обычный текст, а также смайлики внутри тега. При тестировании моего кода эмодзи как-то переводилось как & # xxxxxx;.

Пример кода:

String str = "?";
Document document = DocumentBuilderFactory.newInstance().newDocumentBuilder().newDocument();
Element root = document.createElement("tag");
root.appendChild(document.createTextNode(str));
document.appendChild(root);
Transformer transformer = TransformerFactory.newInstance().newTransformer();
transformer.setOutputProperty(OutputKeys.ENCODING, "UTF-8");
transformer.transform(new DOMSource(document), new StreamResult(new File("test.xml")));

1 Ответ

1 голос
/ 18 января 2020

Emojis по умолчанию будет переведен в их HTML коды, но вы можете предотвратить это, вставив инструкцию, отключающую экранирование для вывода. Вот пример использования вашего кода, для которого требуется всего две дополнительные строки, чтобы отключить экранирование, а затем включить экранирование путем вызова метода Document createProcessingInstruction():

package com.unthreading.emojitoxml;

import java.io.File;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.OutputKeys;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerException;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.stream.StreamResult;

public class App {

    public static void main(String[] args) throws ParserConfigurationException, TransformerException {

        String str = "?";
        Document document = DocumentBuilderFactory.newInstance().newDocumentBuilder().newDocument();
        Element root = document.createElement("tag");
        document.appendChild(document.createProcessingInstruction(StreamResult.PI_DISABLE_OUTPUT_ESCAPING, "")); // <=== ADD THIS LINE
        root.appendChild(document.createTextNode(str));
        document.appendChild(root);
        document.appendChild(document.createProcessingInstruction(StreamResult.PI_ENABLE_OUTPUT_ESCAPING, "")); // <=== ADD THIS LINE
        Transformer transformer = TransformerFactory.newInstance().newTransformer();
        transformer.setOutputProperty(OutputKeys.ENCODING, "UTF-8");
        transformer.transform(new DOMSource(document), new StreamResult(new File("test.xml")));
    }
}

Это содержимое теста. xml после выполнения этого кода:

<?xml version="1.0" encoding="UTF-8" standalone="no"?><tag>?</tag>

Примечания:

...