Google Analytics незаконные cookie-файлы ломают бэкэнд Python - PullRequest
13 голосов
/ 25 ноября 2011

В моем фиде, который публикуется в feedburner, в названии кампании в настройках отслеживания есть русские символы Feed: ${feedUri} ${feedName}. Проблема заключается в том, что он приводит к неверному файлу __utmz, установленному Google Analytics, и не может быть обработан моим бэкэндом (например, web.py).

  File "/home/dw0rm/lib/ve/lib/python2.7/site-packages/web/session.py", line 96, in _load
    self.session_id = web.cookies().get(cookie_name)
  File "/home/dw0rm/lib/ve/lib/python2.7/site-packages/web/webapi.py", line 359, in cookies
    cookie.load(ctx.env.get('HTTP_COOKIE', ''))
  File "/usr/local/lib/python2.7/Cookie.py", line 627, in load
    self.__ParseString(rawdata)
  File "/usr/local/lib/python2.7/Cookie.py", line 660, in __ParseString
    self.__set(K, rval, cval)
  File "/usr/local/lib/python2.7/Cookie.py", line 580, in __set
    M.set(key, real_value, coded_value)
  File "/usr/local/lib/python2.7/Cookie.py", line 455, in set
    raise CookieError("Illegal key value: %s" % key)
CookieError: Illegal key value: )|utmcmd

Эта ошибка произошла в Firefox, и мне удалось исправить это с помощью кода:

def myinternalerror():
    try:
        web.cookies()
    except CookieError:
        if not "cookie_err" in web.input():
            web.setcookie("__utmz", None, domain=web.ctx.host)
            raise web.seeother(web.changequery(cookie_err=1))
    return web.internalerror(render.site.e500())
app.internalerror = myinternalerror

Но сегодня я получил перенаправление cookie_err = 1 даже в Chrome. Я пробовал это на некоторых других сайтах, основанных на web.py и Analytics, и все они вызывают внутреннюю ошибку сервера. И эта ошибка сохраняется до тех пор, пока нелегальный файл cookie не будет удален, что трудно сделать обычному посетителю.

Я хочу знать, какие еще варианты я должен рассмотреть. Возможно, модуль Python Cookie неверен, или это ошибка браузера, которая пропускает неверные cookie. Этот материал можно использовать в злонамеренных целях, поскольку на многих сайтах Python используются модули Google Analytics и Cookie.

Это запрос отслеживания: utm_source=feedburner&utm_medium=twitter&utm_campaign=Feed%3A+cafenovru+%28%D0%9E%D0%BF%D0%B8%D1%81%D1%8C+%D1%82%D1%80%D0%B0%D0%BF%D0%B5%D0%B7%D0%BD%D1%8B%D1%85+%D0%92%D0%B5%D0%BB%D0%B8%D0%BA%D0%BE%D0%B3%D0%BE+%D0%9D%D0%BE%D0%B2%D0%B3%D0%BE%D1%80%D0%BE%D0%B4%D0%B0%29

Неверное значение __utmz cookie - 37098290.1322168259.5.3.utmcsr=feedburner|utmccn=Feed:%20cafenovru%20(Опись%20трапезных%20Великого%20Новгорода)|utmcmd=twitter

Недопустимый файл cookie устанавливается в Google Analytics при доступе к первой странице, а при последующих запросах возникает ошибка на стороне сервера.

Ответы [ 2 ]

5 голосов
/ 04 сентября 2014

Я знаю, что это, вероятно, не тот ответ, который вы ищете, но лучшее решение для этой ошибки - просто обновить ga.js до analytics.js .Analytics.js - это новейшая версия библиотеки веб-отслеживания Google Analytics, входящая в состав универсальной аналитики .Analytics.js записывает только один файл cookie, поэтому он полностью избегает этой проблемы.

Хитрая проблема с этой ошибкой заключается в том, что она существует уже давно, и многие пользователи GA имеют существующие обходные пути.Чтобы исправить это сейчас, нужно было бы взломать многие из этих сайтов, так что я думаю, что Google вряд ли что-то с этим сделает, тем более что analytics.js уже исправил эту проблему, а ga.js скоро будет признан устаревшим.

Еще раз, я знаю, что это не тот ответ, который вы ищете, но я просто хочу повторить, что реализация любого обходного пути для этой проблемы самостоятельно, скорее всего, будет огромной тратой времени.В любом случае вам придется в ближайшее время выполнить обновление, и тогда ваш обходной путь будет ненужным.

Вот еще немного информации о том, как analytics.js использует файлы cookie: https://developers.google.com/analytics/devguides/collection/analyticsjs/domains

1 голос
/ 25 ноября 2011

Это пахнет как проблема кодировки UTF-8.Или, что еще хуже, вы можете использовать KOI8-R или Windows 1251.

В любом случае есть способы избежать проблем.Одним из способов является кодирование Base64 вашей строки cookie перед отправкой, таким образом кириллические символы надежно скрыты.

Но взгляните на свой код.Если вы не UTF-8 кодируете строку cookie перед ее записью, это также может решить проблему.Когда я просматриваю строку, кажется, что это пары кодов, причем первым кодом всегда является D0 или D1.Это говорит о том, что вы используете сырой Unicode на Python, скомпилированном с 16-битными символами Unicode, или используете кодировку UCS-2 для строки вместо UTF-8.

...