Я понятия не имею, как добавить поддержку многобайтового кодирования, и очень мало знаний о многобайтовых языках.Работая над поисковой системой, мое приложение сканирует код на всех языках программирования.Некоторые исходники могут иметь кодировку CJK в разделе комментариев.Для простоты я беру java в качестве примера исходного кода, и мое приложение также находится в java.
Во-первых, я хочу написать контрольные примеры, чтобы увидеть, имеет ли исходный код для индексации кодировку CJK иесли это закодировано моим приложением.Я хочу, чтобы мои тесты не прошли, если поддержка не включена, чтобы их можно было добавить в будущем.
Но я понятия не имею, как его тестировать, как вводить CJK во входные выборки для модульного теста и что будет выводиться вКонсоль приложения Java.