Тип содержимого для URL-адреса автоматически изменяется с текста / html на приложение / rss + xml при загрузке RSS-URL / ленты новостей / - PullRequest
0 голосов
/ 27 апреля 2020

Существует ряд странных поведений, которые, похоже, происходят из-за проблемы с заголовком Content-Type.

Сайт будет работать нормально, но тогда проблема происходит "случайно" в течение дня. Но Я могу повторить проблему , выполнив следующие действия:

  1. На сервере очистите HTCache с диска мод-кэша и flu sh кеш из apache модуля скорости страницы.
  2. Проверьте URL любой страницы с моего сайта WordPress, на redbot.org/, где отображаются правильные заголовки.

    Content-Type: text/html; charset=UTF-8

  3. Go в любой браузер и загрузите URL фида. mysite.com/en/feed/ Канал XML выглядит хорошо. Или go до http://redbot.org/ и проверьте заголовок корма, который выглядит хорошо.

    Content-Type: application/rss+xml; charset=UTF-8

  4. Go вернитесь и проверьте URL любой страницы на http://redbot.org/. Теперь Content-Type переключился с text / html на rss + xml!

    Content-Type: application/rss+xml; charset=UTF-8

Этот автомат c переключения типа контента делает Браузеры в приложении (IAB), такие как Facebook и Instagram go berzerk. Вместо того, чтобы IAB отображал страницу html, он загружает файл XML для канала RSS. RSS-лента будет случайной, либо лента комментариев для какой-то случайной страницы, либо лента сообщений.

Множество проблем, связанных с отображением RSS-ленты вместо загрузки URL-адреса блога на сайте. ,

  • Тестирование скорости страниц Google иногда показывает RSS-канал. https://developers.google.com/speed/pagespeed/insights/
  • Валидатор карт Twitter, Валидатор отладчиков Facebook, чат whatsapp и валидатор LinkedIn, не показывающий изображения метаданных, заголовок и описание.
  • Выполнение этой команды в linux будет показывать RSS-канал вместо HTML сайта

    curl -A Twitterbot mysite.com/

  • Тестирование моего RSS-канала (mysite.com/en/feed/) в https://validator.w3.org/feed/ иногда показывает комментарии RSS-канал вместо публикации RSS-канала.

Я исключил следующие возможные причины , потому что я либо обновил каждый элемент, либо проверил код на наличие ошибок:

  • Обновлен WordPress
  • Обновлены плагины
  • Обновлена ​​тема
  • Больше не вставляется / Запись / вставка CSS таблиц стилей непосредственно в HTML страницу
  • Сообщения НЕ являются пользовательскими типами сообщений. Это обычные сообщения WordPress.
  • Использовал Wordpress Native Text Editor для записи сообщений, чтобы предотвратить ошибки кода RSS, генерируемые плагинами, такими как TinyMCE Editor.
  • Проверка RSS-канала подтверждена. Протестировано с: validator.w3.org/feed/ и Feedvalidator.org
  • При отключенном модуле Apache PageSpeed ​​проблема все еще возникает.

Я также проверил путем деактивации все плагины, кроме одного, polylang, который делает сайт двуязычным. Я не могу отключить polylang, так как без него многие сообщения не будут отображаться на сайте.

Что временно решает проблему на данный момент: Очистка HTCache вручную всегда делает Content- Введите обычные URL-адреса обратно в HTML / TXT.

sudo htcacheclean -v -t -p /var/cache/apache2/mod_cache_disk -l1b -L1b

Итак, я отключил cache_disk, и сайт работает нормально весь день. Каждый раз, когда я загружаю URL-адрес RSS-канала в браузере, а затем проверяю заголовок любой веб-страницы на Redbot.org, заголовок отображается правильно (html / txt)

sudo a2dismod cache_disk
sudo systemctl restart apache2
sudo systemctl stop apache-htcacheclean

Я до сих пор не понимаю, что такое root этой проблемы в первую очередь. Поэтому я сбит с толку и обращаюсь ко всем вам за помощью.

Есть идеи, что может быть причиной такого странного поведения и как это исправить?

...