Question

Я анализирую много .java-файлов с последней JavaParser .

Файлы анализируются следующим образом:

in = new FileInputStream(file);
cu = JavaParser.parse(in);

Следующее исключениевозникает, как только один из исходных файлов содержит умлаут на немецком языке (ä, ö, ü, ß) (они появляются только в комментариях .java-файла)

Исключение в теме "main "japa.parser.TokenMgrError: Лексическая ошибка в строке 82, столбец 17. Обнаружено:" \ ufffd "(65533), после:" "

Что можно сделать, чтобы решить эту проблему.Я не могу изменить все исходные файлы.

Joachim Isaksson · Answer 1 · 01 марта 2012

На JavaParser.parse() имеется перегрузка, которая принимает кодировку. В зависимости от кодировки вашего файла попробуйте это;

cu = JavaParser.parse(in, "ISO8859_1");

или это

cu = JavaParser.parse(in, "UTF8");

Все поддерживаемые кодировки перечислены здесь .

Jon Skeet · Answer 2 · 01 марта 2012

Скорее всего, вам просто нужно указать правильную кодировку:

cu = JavaParser.parse(in, "utf-8");

... или любую другую действительную кодировку.

JavaParser исключение «Лексическая ошибка» возникает при разборе файла, содержащего немецкие умлауты (äöüß)

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

JavaParser исключение «Лексическая ошибка» возникает при разборе файла, содержащего немецкие умлауты (äöüß)

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы