Как декодировать Google Gclids - PullRequest
       63

Как декодировать Google Gclids

20 голосов
/ 14 декабря 2008

Теперь я понимаю, что первоначальным ответом на это, вероятно, будет «вы не можете» или «использовать аналитику», но я продолжу в надежде, что у кого-то больше понимания, чем у этого.

В Google AdWords с «автоматической пометкой» добавляется «gclid» (предположительно «идентификатор клика Google»), чтобы перейти на рекламируемый сайт. Он появляется в веб-журнале, поскольку является параметром запроса, и он используется аналитиками для привязки этого посещения к объявлению / кампании.

Что я хотел бы сделать, так это извлечь любую полезную информацию из gclid, чтобы провести собственный анализ нашего трафика. Причины этого:

  • Статистика несовершенна, но если мы сопоставляем их, мы точно знаем, какие предположения мы сделали и как они были рассчитаны.
  • Мы можем связать данные с остальными нашими данными и получить гораздо более точную статистику по коэффициенту конверсии.
  • Нам не нужно полагаться на javascript для конверсий.

Теперь ясно, что gclid закодирован в base64 (или некотором близком варианте), и некоторые его части отличаются больше, чем другие. Кроме того, я не смог определить, к чему это относится.

Кто-нибудь знает, как я могу подойти к расшифровке, или кто-нибудь уже связал gclids с кампаниями или даже аккаунтами?

Я разговаривал с парой людей в Google, и, несмотря на их девиз "не будь злым", они совершенно не хотели обсуждать возможность разглашения этой информации даже в рамках NDA. Кажется, им нравится монополия, которую они имеют над нашей веб-статистикой.

Ответы [ 11 ]

23 голосов
/ 17 февраля 2009

Самое простое решение - вручную пометить ваши ссылки параметрами отслеживания кампании Google Analytics (utm_source, utm_campaign, utm_medium и т. Д.), А затем извлечь эти данные.

gclid зависит не только от учетной записи AdWords / кампании / и т. Д. Если вы дважды нажмете на одно и то же объявление AdWords, оно может дать вам разные gclids, поскольку с этим конкретным кликом также связаны все виды данных о сессиях и затратах.

Gclid, вероятно, не на 100% случайный, правда, но я был бы очень удивлен и обеспокоен, если бы можно было извлечь все данные Adwords из этого числа. Это будет ОГРОМНЫЙ недостаток безопасности (т. Е. Произвольный пользователь может просматривать ваши данные AdWords). Скорее всего, псевдослучайный gclid создается с каждым показом, и если на это объявление нажимают, gclid регистрируется в Adwords (в ​​противном случае он выбрасывается). Затем Google Analytics использует это число для сверки данных с Adwords после факта. Кроме этого, нет никакого внутреннего значения в самом числе gclid.

Что касается вашего последнего замечания, попытка взлома или обратного инжиниринга этой информации прямо запрещена как в Условиях использования Google Analytics, так и в Условиях использования Google Adwords, и является основанием для постоянного бана. Кроме того, в TOS, с которым вы согласились при подписке на эти услуги, говорится, что вы не можете использовать ваши данные так, как вам хочется. Google предоставляет бесплатный сервис, поэтому есть строки Если вам не нравится полный контроль над вашими данными, есть множество других решений. Однако за этот вид контроля вы будете платить больше.

Google зарабатывает почти все свои деньги от продажи рекламы. Adwords является их крупнейшим продуктом для зарабатывания денег. Они не собираются давать вам конфиденциальную информацию о том, как это работает. Они не знают, кто вы, или что вы собираетесь делать с этой информацией. Неважно, если вы подпишете соглашение о неразглашении, и у них есть право обратиться к вам в суд; если вы передадите эту информацию конкуренту, ваша жизнь не будет достаточной для того, чтобы вернуть деньги, которые вы потеряли.

Извините, что сломал это вам, но "Не будь злым" или нет, Google - это бизнес, а не благотворительность. Они не стали одной из самых успешных компаний в мире, отдав свой алгоритм поиска первому парню, который попросил об этом.

17 голосов
/ 16 декабря 2013

Параметр gclid кодируется в Буферы протокола , а затем в варианте Base64.

См. Это руководство по декодированию gclid и его интерпретации, включая функцию PHP (лицензированную Apache), которую вы можете использовать.

Как правило, в нем закодированы 3 параметра, один из которых является меткой времени. Другие 2 пока не известны.

Что касается понимания того, что означают эти другие параметры - может быть полезно сравнить его с параметром ei, который закодирован чрезвычайно похожим образом (в основном, буфер протокола с удаленными ключами ). Параметр ei также имеет метку времени с микросекундами и двумя другими целыми числами.

8 голосов
/ 15 апреля 2009

К вашему сведению, я только что опубликовал краткий анализ некоторых данных glcid с моих сайтов в этом сообщении . В gclid определенно есть какая-то структура, но ее трудно расшифровать.

4 голосов
/ 12 марта 2014

Я думаю, что вы можете получить все вкусности, связанные с gclid, через Google Adword API В частности, вы можете запросить отчет об эффективности кликов.

https://developers.google.com/adwords/api/docs/appendix/reports#click

4 голосов
/ 04 мая 2011

Я тоже работал над этой проблемой в нашей компании. Нам бы хотелось лучше понять, что делают наши AdWords, но мы разочарованы ограничениями в Google Analytics.

Наше текущее решение - искать в журналах доступа Apache запросы GET с помощью регулярного выражения:

.*[?&]gclid=([^$&]*)

Если это существует, то мы смотрим на строку реферера, чтобы получить ключевое слово:

.*[?&]q=([^$&]*).*

Альтернативный вариант - изменить веб-журнал Apache, чтобы начать регистрировать cookie-файл __utmz, который устанавливает Google, и в нем должно быть ключевое слово для utmctr. Google __utmz cookie, и вы сможете найти много информации.

Насколько точна строка реферера? Не 100%. Брандмауэры и устройства безопасности уберут это. Но разбирая его самостоятельно, вы получаете больше гибкости, чем Google Analytics. Было бы неплохо отправить gclid в AdWords и получить данные обратно, но эта функция не выглядит доступной.

РЕДАКТИРОВАТЬ: так как я написал это, мы также создали наши собственные теги, которые добавляются к каждому URL назначения в качестве параметра запроса. Каждый тег - это просто хэш md5 текста, группы объявлений и названия кампании. Мы берем его, используя регулярное выражение из журнала доступа, и ищем его в базе данных SQL.

1 голос
/ 14 декабря 2008

Ну, это не ответ, но подход аналогичен тому, как вы решаете любую проблему с криптографией.

Возможность 1: они просто случайные, в этом случае вы облажались. Это аналог одноразовой накладки.

Возможность 2: они "что-то значат". В этом случае вы должны контролировать окружающую среду.

  1. Получить хорошую базу данных из них. Найти gclids для вашего сайта и другие. Запишите все случаи, когда произошли все клики, и любые другие потенциально полезные данные
  2. Получи трещину! Как вы уже начали, начните регрессировать собранные данные с вашими известными, и посмотрите, можете ли вы найти шаблоны, использующие методы расшифровки
  3. Начните очищать случайных гклидов и посмотрите, куда они вас приведут.

Я бы не надеялся, что это будет успешным, но я желаю вам удачи!

0 голосов
/ 09 сентября 2016

Это не программный способ декодирования параметра GCLID. Скорее всего, вы просто пытаетесь определить кампанию, группу объявлений, ключевое слово, место размещения, рекламу, которая привела к клику и конверсии. Для этого вы можете загрузить GCLID в AdWords в качестве отдельного типа конверсии, а затем сегментировать по типу конверсии, чтобы перейти к критериям, которые инициировали конверсию. Эти шаги:

  1. В интерфейсе AdWords выберите Сервис-> Конверсии-> Добавить конверсию с источником "Импорт из кликов"
  2. Посетите раздел справки AdWords об импорте конверсий https://support.google.com/adwords/answer/7014069 и создайте файл массовой загрузки со своими значениями GCLID, назначив вам конверсии с новым типом конверсии "Импорт из кликов"
  3. Загрузка конверсий в AdWords в Инструменты-> Конверсии-> Действия с конверсиями (Загрузка) в левой навигационной панели
  4. Перейти на вкладку кампании, Сегмент-> Конверсии-> Название конверсии
  5. Найдите ваше новое имя конверсии в списке сегментов, отсюда и конверсия. Продолжайте этот процесс на вкладке групп объявлений и ключевых слов, пока не узнаете критерии происхождения GCLID
0 голосов
/ 15 февраля 2013

Похоже, мой представитель слабый, поэтому я просто опубликую другой ответ, а не комментарий.

Это не ответ, ясно. Просто высказываю некоторые мысли.

Когда вы включаете автоматическую пометку в Adwords, параметры gclid не добавляются к целевым URL. Скорее они добавляются к целевым URL во время выполнения серверами отслеживания кликов Google. Итак, происходит одно из двух:

  1. Серверы кликов хранят gclid вместе с идентификаторами сущности Adwords, чтобы в дальнейшем Google Analytics могла их найти.

  2. У gclid есть идентификаторы сущностей, которые каким-то образом закодированы, чтобы Analytics могла их декодировать.

С точки зрения производительности кажется маловероятным, чтобы Google реализовал что-либо подобное варианту 1. Принудительное использование Google Analytics "присоединения" gclid к идентификаторам Adwords выглядит исключительно неэффективно в масштабе.

0 голосов
/ 16 января 2013

Вот мысль: есть ли шанс, что gclid - это просто криптографический хеш, а-ля bit.ly или какой-либо другой сокращатель URL?

В этом случае содержимое хешированного текста будет записано в базу данных и заменено уникальным идентификатором.

В конце концов, gclid сокращает кучу длинных текстов.

Принимает этот пример: www.example.com?utm_source=google&utm_medium=cpc

преобразуется в это: www.example.com?gclid=XDF

как сокращение URL.

Чтобы зашифровать криптографический хеш, понадобился бы подстановочный шифр ... не такая простая задача: https://crypto.stackexchange.com/questions/300/reverse-engineering-a-hash

Может быть, кто-то глубоко копается в журналах, ищет шаблоны и т.д ...

0 голосов
/ 14 января 2010

Я согласен с Офиром и Крисом. Мне кажется, что это чисто серийный номер / уникальный идентификатор клика, который раскрывает свои секреты только тогда, когда системы Analytics и Adwords общаются друг с другом за кулисами.

Зная это, я бы порекомендовал взглянуть на ссылающийся URL-адрес и извлечь из него как можно больше информации, чтобы использовать его в настройке отслеживания кликов на сервере.

Например, я живу в Новой Зеландии и использую Firefox. Это поиск на панели инструментов Google Firefox для «переполнения стека»: http://www.google.co.nz/search?q=stack+overflow&ie=utf-8&oe=utf-8&aq=t&client=firefox-a&rlz=1R1GGLL_en-GB

Вы можете видеть, что: а) я использую домен .NZ, б) мое ключевое слово "стек + переполнение", в) я использую Firefox.

Наконец, если вы также храните полный URL-адрес целевой страницы, вы можете сохранить GCLID, который сообщит вам, что посетитель пришел из платного, тогда как если у него нет GCLID, то пользователь должен был прийти из обычного поиска. (если разметка URL включена, конечно).

Теоретически это позволит вам затем найти ключевое слово в вашей кампании и выяснить, из какой группы объявлений они были получены. Знать креатив, вероятно, было бы невозможно, если только вы не разделите тестирование своих целевых URL или не пометите их как-нибудь.

...