У Ализы правильная идея, вы хотите искать «точки сочленения» (в REST, в основном, где передается параметр).Поиск только одной точки изменения становится хитрым
Пример
http://www.example.com/foo/1/new
http://www.example.com/foo/1/edit
http://www.example.com/foo/2/edit
http://www.example.com/bar/1/new
Их можно сгруппировать несколькими одинаково хорошими способами, поскольку мы не имеем представления о семантике URL.Это действительно сводится к вопросу об этом - это часть URL-адреса дескриптора REST или параметр.Если мы знаем, что представляют собой все дескрипторы, остальные являются параметрами, и все готово.
Дайте достаточно большой набор данных, мы бы хотели посмотреть статистику всех URL на каждой глубине.например, / x / y / z / t /.Мы будем подсчитывать количество вхождений в каждом слоте и генерировать большую общую таблицу распределения вероятностей.
Теперь мы можем посмотреть на распределение символов.Высокий счет в слоте означает, что это скорее всего параметр.Мы начинаем снизу, ищем события условной вероятности, т. Е. Какова вероятность того, что x будет foo, тогда какова вероятность того, что y будет чем-то заданным x, и т. Д. И т. Д.систематический способ их извлечения, но это похоже на многообещающее начало