TYPO3: Bingbot создает ошибку ext_form, которая кэшируется - PullRequest
0 голосов
/ 16 октября 2018

У нас проблема с одной из наших установок TYPO3.Бингбот, который посещает сайт, вызывает контроллер старого расширения ext_form без параметров и создает ошибку.

207.46.13.XXX - - [16/Oct/2018:00:18:48 +0200] "GET example.html?tx_form_form%5Baction%5D=process HTTP/1.1" 200 10256 "-" "Mozilla/5.0 (compatible; bingbot/2.0; +http://www.bing.com/bingbot.htm)"

Проблема для нас не в том, что это происходит, а в том, что TYPO3 кэширует сайт с «Упс, произошла ошибка! Код: 20181016001848e0153dcf» в качестве содержимого.

Есть ли способсказать TYPO3, чтобы не кэшировать сайт, если произошла ошибка, или отправить бота на сайт 404, если он вызывает сайт с ложными параметрами.

1 Ответ

0 голосов
/ 16 октября 2018

Вы можете сделать несколько вещей:

  • исключить страницу с параметрами в robots.txt ( Edit: После рассмотрения это решение, вероятно, не подходит для конкретной проблемы)
  • перенаправление в .htaccess, если страница вызывается без обязательного параметра, перенаправление также должно распознаваться ботом.
  • проверить, почему бот даже вызывает страницу без обязательного параметра,возможно, вы можете избежать этого.
  • bing может быть настроен для определенного URL, эта страница может быть отправной точкой для вас.

РЕДАКТИРОВАТЬ:
Пример для htaccess (не тестировался):

RewriteCond %{QUERY_STRING} .+
RewriteRule ^example.html?tx_form_form%5Baction%5D=process$ example.html [L,R=301,QSD]

Целью example.html может быть что угодно, либо пользовательская страница 404, либо просто просмотр списка.Код 301 в [L,R=301,QSD] можно настроить в соответствии с Кодами статуса HTTP (3xx) .Если он перенаправлен на (пользовательскую) страницу 4xx, код статуса HTTP должен быть соответствующим (404, или, возможно, другое сообщение о статусе 4xx, например 400).

...