Стандартный и надежный способ отслеживания подписчиков RSS? - PullRequest
10 голосов
/ 25 июля 2010

Каков наилучший способ надежного отслеживания подписчиков RSS без с помощью Feedburner?Некоторые очевидные подходы, такие как отслеживание по IP или количеству хитов, имеют некоторые недостатки.IP-адреса могут меняться при каждом запросе, или несколько пользователей могут использовать один и тот же IP-адрес.Кроме того, читатели каналов могут запрашивать канал несколько раз в день или даже час.Обе проблемы затрудняют получение достоверной статистики по уникальным подписчикам.

Я читал статьи обоих авторов: Leo Notenboom и Tim Bray на эту тему, но ни одно из их предложений, похоже, не решает, как правильно отслеживать подписчикови надежный способ.Лео предлагает создать уникальный идентификатор, сгенерированный программно, для добавления к URL-адресу канала RSS при каждой загрузке ссылающейся страницы.Тим выступает за то, чтобы читатели RSS генерировали уникальный хэштег, а также предлагали различные варианты: от отслеживания ссылок до использования файлов cookie.Уникальный URL-адрес будет надежным, но у него есть два недостатка: это не удобный для пользователя URL-адрес, который создает дублирующий контент для SEO.Существуют ли другие надежные способы отслеживания подписчиков RSS?Как Feedburner оценивает подписчиков?

Ответы [ 4 ]

4 голосов
/ 03 августа 2010

Стандарт и Надежность - это не совсем слова в словаре RSS :-) Надо помнить, что у вещи даже не было стандартного XSD через сколько лет? Если, отслеживая, вы имеете в виду «считать», есть несколько вещей, которые вы можете сделать, и тактика зависит от цели, то есть демонстрировать большое число или небольшое число? Это маркетинговая вещь, поэтому вы должны определить свои цели: -)

Возможно, для начала вам придется классифицировать IP-номера, чтобы иметь базовую коллекцию больших / корпоративных / зонтичных IP-номеров. Для них вы можете использовать реферер в качестве разумных критериев фильтрации и считать все остальное уникальным, если не доказано иное. Подавляющее большинство IP-номеров остаются стабильными в течение примерно 2 дней, но опять же всегда полезно использовать базовую логику реферера в качестве фильтра для людей, которые просто «нажимают», так сказать.

Тогда вам нужен приличный список агрегаторов и классификация того, как они обрабатывают URL-адреса, и если они полностью скрывают конечных читателей, вам нужны либо опубликованные, либо предполагаемые средние значения - всегда справедливо использовать справедливое распределение среднего количества. Использование файлов cookie может помочь в сборе IP-адресов агрегаторов и различении автоматических агентов и частных лиц.

Одна очень важная вещь - помнить, что вы не можете использовать только один метод и ожидать, что это будет серебряная пуля - вам нужно использовать эти 3-4 аспекта одновременно, плюс основные статистические рассуждения.

4 голосов
/ 28 июля 2010

Нет действительно стандартного способа сделать это.Подсчет подписчиков всегда ненадежен, но вы можете получить хорошие оценки с его помощью.

Вот как Google это делает ( источник ):

Подсчет подписчиков рассчитывается путем сопоставленияКомбинации IP-адресов и считывателей каналов, а затем мы используем наше детальное понимание множества читателей, агрегаторов и ботов на рынке, чтобы сделать дополнительные выводы.

Конечно, часть этого проста для Google, так каксначала они могут рассчитать, сколько пользователей Google Reader подписаны на данный канал.После этого они также используют сопоставление IP-адресов, и это то, что вы также должны использовать.

Вы можете рассчитать отдельные IP-адреса (то есть уникальные) из журналов веб-серверов, но это будет считать 10 человек как 1, если онивсе используют один и тот же адрес.Вот почему вы должны проверять HTTP-заголовки, которые отправляет клиент, более конкретно поля заголовка HTTP_X_FORWARDED_FOR и HTTP_VIA.Вы можете использовать адрес HTTP_VIA в качестве «основного» адреса, а затем вычислить, сколько уникальных адресов HTTP_X_FORWARDED_FOR подписано на канал.Если у подписчика нет этих полей для добавления прокси, он считается уникальным IP-адресом.Это должно быть обработано в коде, который генерирует канал.Вы также можете добавить поиск GeoIP для IP-адресов и сохранить все в базе данных.Это позволит вам увидеть, в какой стране больше всего подписчиков на ваш канал.

У него тоже есть проблемы.Все прокси не используют эти поля, и это не решает проблему подсчета подписчиков за шлюзами NAT.Это, однако, хорошая оценка.Кроме того, вы, вероятно, больше интересуетесь порядком величины, а не точным количеством подписчиков, не так ли?Если счетчик говорит, что у вас 5989 подписчиков, у вас, вероятно, больше подписчиков, так как счетчик дает вам нижнюю границу.

0 голосов
/ 31 июля 2010

Если вы сконфигурируете свой RSS-канал так, чтобы он требовал какой-либо аутентификации, вы можете использовать метрики на основе пользователя вместо метрик на основе ip.Хотя это было бы технически правильным решением, получение людьми, которые выбирают аутентифицированный блог для чего-либо, кроме сценария интрасети, является натяжкой.

0 голосов
/ 25 июля 2010

Вы можете запросить в журналах вашего веб-сервера трафик на ваш RSS-канал, возможно, отфильтровав его по IP, чтобы получить количество уникальных номеров.

Проблема в том, что люди будут ежедневно проверять канал.Частота обращений к вашему RSS-каналу одним человеком может варьироваться в зависимости от дня, а число может быть ниже.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...