Пользовательский канал ATOM дублирует мои записи в Google Reader - PullRequest
4 голосов
/ 26 марта 2012

У меня проблема с генерируемым фидом ATOM и дублирующимися в читателях записями.

Я разработал класс C # для создания записей фида ATOM и, в конечном итоге, полный объект фида.из моих элементов данных.Он соответствует RFC 4287 для формата ленты синдикации Atom.

Фид генерируется правильно.В настоящее время он не проверяется, так как я добавляю два нестандартных элемента расширения и еще не создал для него правильное пространство имен, но эта проблема существует, даже когда она проверяется.

Я также вижу два разныхповедение между моей прямой фидом Atom и фидом FeedBurner.

Вот два фида.http://feeds.feedburner.com/oldtownhome/ http://www.oldtownhome.com/index.atom

Я подписался на оба канала через Google Reader и получаю сообщения от других пользователей о том, что они видят ту же проблему, но это не соответствует тому, когда они видят проблему против меня.

Проблема с фидом № 1: элементы фида, которые в данный момент находятся в фиде (25 фид-записи), дублируются случайным образом.Это могут быть отдельные дубликаты в течение одного дня, дубликаты нескольких элементов в течение нескольких дней или иногда все содержимое фида кажется «переизданным» в течение одного дня, даже если они уже существуют в предыдущие дни.

Проблемас фидом № 2: кажется, что записи дублируются случайным образом, даже если записи выпадают из основного фида (хотя они могут быть доступны через другие фиды Atom на сайте, например, отдельные фиды Atom категории).

I 'пробежался через все, что я могу придуматьЯ гарантировал, что pubDate никогда не изменяется, каждая ссылка на документ неизменна со времени публикации, добавил узел с фактическим и неизменным guid сообщения в качестве значения, но, похоже, ничего не помогает.Я даже заставил feedburner использовать мой XML в надежде, что проблема, возможно, была в feedburner.

Я в растерянности и надеюсь, что у других была похожая ситуация и есть какой-то совет.

Обновление Возможно связанный элемент, моя новостная рассылка доставила письмо, которое пришло вчера с «Последними постами», сообщило о 25 новых постах (общее количество в основном фиде, откуда он получает эту информацию).Из этих 25 постов 24 не были новыми и доставлялись по одному за предыдущие 30 дней или около того.Только 1 сообщение было новым, и оно было сверху смешано с остальными сообщениями.

Возможно, это связано с некоторой проблемой с подключением, когда Feedburner не может получить доступ к моему каналу (потому что он не работаетили что-то), а потом, когда он вернется в онлайн Feedburner вещи все содержимое нового?У меня больше года не было никаких сбоев с моим сервером, но были проблемы, которые, возможно, длились от 30 секунд до 5 минут.

Это самая неприятная проблема, потому что Feedburner / Google Reader оба такиечерные ящики.

1 Ответ

2 голосов
/ 07 июня 2012

Если кто-то наткнется на этот случайный пост при поиске дубликатов почтовых решений Google Reader, я думаю, что, возможно, я обнаружил основную причину проблемы, и это раздражает.

В блоге было много много атомных каналов, но только один основной. Основной канал перечислял 25 самых последних сообщений в любой момент времени, но помимо этого в других метаданных контента были указаны другие доступные для обнаружения каналы. К ним относятся каналы категорий, каналы комментариев, каналы отдельных страниц, популярные каналы сообщений и т. Д. Похоже, что Google Reader, со всей своей мудростью, сканировал все эти каналы и рассматривал их как абсолютно разные каналы и элементы, даже если они у всех был один и тот же уникальный идентификатор для постов (URL для поста). После того, как я удалил все из них в качестве обнаруживаемых каналов, а также удостоверился, что перенаправил основной канал, отличный от www, на канал с www, чтобы убедиться, что все URL уникальны и не дублированы, кажется, что все в порядке с миром, и читатель Google не больше дублирования контента.

Что ж, это было много месяцев раздражающих и расстраивающих элементов, пытающихся найти и устранить неисправность службы, которая абсолютно не способна отлаживать или предоставлять полезную информацию для разработчика.

Надеюсь, это кому-нибудь поможет ... когда-нибудь.

...