Я хотел бы спросить, есть ли какой-либо пакет или библиотека Java, которые имеют стандартную нормализацию URL?
5 компонентов представления URL
http://www[dot]example[dot]com:8040/folder/exist?name=sky#head
- схема: http
- авторитет: www.example.com: 8040
- путь: / папка / существовать
- запрос: ? Name = sky
- фрагмент: # голова
3 типа стандартной нормализации URL
Нормализация на основе синтаксиса
- Нормализация регистра - преобразование всех букв в компонентах схемы и полномочий в нижний регистр
- Нормализация в процентах - декодировать любой октет в процентах, соответствующий незарезервированному символу, например,% 2D для дефиса и% 5 для подчеркивания
- Нормализация сегментов пути - удаление точечных сегментов из компонента пути, таких как ‘.’ И ‘..’
Нормализация на основе схемы
- Добавить трейлинг ‘/’ после компонента авторизации URL
- Удалить номер порта по умолчанию, например, 80 для схемы http
- Обрезать фрагмент URL
Нормализация на основе протокола
- Уместно, только когда результаты доступа к ресурсам эквивалентны
- Например, example.com/data направляется на example.com/data/ сервером происхождения