После того, как был введен в заблуждение предыдущим вопросом: ТАК google-analytics-domain-data-без фильтрации
Я экспериментировал с очень простой собственной аналитической системой.
Таблица MySQL:
hit_id, subsite_id, timestamp, ip, url
subsite_id позволяет мне перейти к папке (как объяснено в предыдущем вопросе).
Теперь я могу получить следующие метрики:
- Просмотры страниц - сгруппированы по subsite_id и дате
- Уникальные просмотры страниц - сгруппированы по subsite_id, date, url, IP (не обязательно, как это делает Google!)
- Обычная "наиболее посещаемая страница", "вероятное время посещения" и т. Д. И т. Д.
Я теперь сравнил свои данные с данными в Google Analytics и обнаружил, что Google имеет более низкие значения для каждой метрики . То есть, моя собственная установка рассчитывает больше хитов, чем Google.
Итак, я начал дисконтировать IP-адреса от различных веб-сканеров, Google, Yahoo и Dotbot.
Короткие вопросы:
- Стоит ли мне сопоставлять список
все основные сканеры со скидкой, это
какой список может регулярно меняться?
- Есть ли другие очевидные фильтры
что Google будет обращаться к GA
данные?
- Какие еще данные вы бы
собирать, что может быть полезным в дальнейшем
по линии?
- Какие переменные
Google использует для разработки входа
искать ключевые слова на сайте?
Данные будут использоваться только для нашей собственной "системы ранжирования дочерних сайтов", но я хотел бы показать моим пользователям некоторые базовые данные (просмотры страниц, наиболее популярные страницы и т. Д.) Для справки.