На многих сайтах переопределение URL-адресов осуществляется на основе URL-адреса, аналогичного
/news/ArticleID/Some-Title-Text-Goes-Here/
. Примените правило перезаписи в соответствии с
Rewrite /news/([0-9]*)/.* /news/article.lang?ArticleID=$1
*.1009 *
Итак
/news/123/Lorem-Ipsum/
переписано на
/news/article.lang?ArticleID=123
Поскольку все это заботит, это идентификатор статьи,текст заголовка может быть любым.
В прошлом я написал множество таких правил, не считая, что это потенциальная проблема, до сегодняшнего утра, когда крупная британская газета смутилась из-за такого поведения.
Статья здесь
http://www.independent.co.uk/life-style/food-and-drink/kate-middleton-jelly-bean-expected-to-fetch-500-2269573.html
имеет URL-адрес, измененный на
http://www.independent.co.uk/life-style/food-and-drink/utter-PR-fiction-but-people-love-this-shit-so-fuck-it-lets-just-print-2269573.html
Этот модифицированный URL был опубликован в твиттере и быстро стал вирусным, вызывая большое смущение для рассматриваемой газеты.
Каков наилучший способ предотвратить это / смягчить последствия, не теряя преимущества переписывания URL-адреса?
(я отмечаю, стекВопросы переполнения выбрасывают 301 на правильный URL, если вы измените его URL,это достаточно очевидно для большинства пользователей или у нас должен быть текущий канонический URL-адрес и список априоров с 301 по каноническому и все остальные 404?)