Я использую синтаксический анализатор саксофона для разбора xml / rss, но странная проблема состоит в том, что xml содержит следующие странные символы. “
(не регулярно, наклонно),…, ‘
и другие. Эти цитаты не являются регулярными она наклонена. Проблема с парсером UTF-8 и SAX.
// create the factory
SAXParserFactory factory = SAXParserFactory.newInstance();
// create a parser
SAXParser parser = factory.newSAXParser();
замена строки:
public static String replaceAll(String source, String pattern,
String replacement) {
if (source == null) {
return "";
}
StringBuffer sb = new StringBuffer();
int idx = -1;
int patIdx = 0;
while ((idx = source.indexOf(pattern, patIdx)) != -1) {
sb.append(source.substring(patIdx, idx));
sb.append(replacement);
patIdx = idx + pattern.length();
}
sb.append(source.substring(patIdx));
return sb.toString();
}