Из того, что я могу извлечь из вопроса, все, что вы действительно хотите в конечном итоге сделать, - это отобразить текст.
Вы уже понимаете, что то, что хранится в памяти или в файлах, представляет собой последовательности байтов, чистые и простые, икаким-то образом у вас есть трехбайтовая последовательность e5 a4 a7, потому что именно так кодируется символ OOKII HAJIME OOINI (大) в UTF-8.
Чтобы поместить этот символ в URL с помощью Java, тогда да, выиспользуйте URLEncoder и вы получите% E5% A4% A7.Но если вы хотите отобразить его в JSP, то я бы определенно рекомендовал сущность HTML 大
, поскольку конечные пользователи не будут настраивать кодировку символов своего браузера, чтобы связываться с вашим потоком байтов, если вы решите отправитьнеобработанные байты UTF-8.
То, как вы это сделаете, зависит от того, хранятся ли ваши данные в виде байтового массива или реальной строки Java.Как правило, для вывода числовых сущностей HTML вы можете сделать это программно, превратив каждый символ с кодовой точкой выше 7F в символы вида
& # x codepoint ;
или найти в Интернете библиотеку, которая сделает это за вас.Вероятно, больше работы, если вы обрабатываете байтовый массив, но это можно сделать.StringEscapeUtils от Commons Lang обрабатывает известные именованные объекты, но я не верю, что он создаст числовые объекты HTML для символов с большими кодами.