python регулярное выражение для идентификации файлов cookie в заголовках http - PullRequest
0 голосов
/ 09 января 2020

я пытаюсь использовать python регулярное выражение, чтобы определить имена повара ie в наборе-повара ie и заголовки повара ie.

Вот, например, два набора-повара ie Заголовки:

PE_SESSION=846e62055890a5376ab62; path=/; domain=www.provenexpert.com, _pelocale=bG9jYWxlfGVffffg%3D%3D; expires=Sat, 08-Feb-2020 00:17:36 GMT; Max-Age=2592000; path=/; domain=www.provenexpert.com, _pelocale=bGfffH4%3D; expires=Thu, 09-Jan-2020 00:17:35 GMT; Max-Age=0; path=/, _pelocale=bGfffH4%3D; expires=Thu, 09-Jan-2020 00:17:35 GMT; Max-Age=0; path=/; domain=www.provenexpert.com, PE_SESSION=deleted; expires=Thu, 01-Jan-1970 00:00:01 GMT; Max-Age=0; path=/, PE_SESSION=deleted; expires=Thu, 01-Jan-1970 00:00:01 GMT; Max-Age=0; path=/; domain=www.provenexpert.com

fr=0sXTIvw8Afffff44nEg...1.0.BeFnEg.; expires=Wednesday, 08-Apr-2020 00:17:36 GMT; path=/; domain=.facebook.com; SameSite=None; HttpOnly; secure

А вот два примера для повара ie Заголовки:

GPS=1; VISITOR_INFO1_LIVE=M_6Wfff3NL_fo; YSC=8sff3fBHU
_ga=GA1.2.92423286.15234056; _gid=GA1.2.10234234641.157343056; _gat=1; _fbp=fb.1.157852342336.154333700

Теперь меня интересуют имена повара ie. Здесь имена повара ie: PE_SESSION, _pelocale, fr, GPS, VISITOR_INFO1_LIVE, YSC, _ga, _gid, _gat и _fbp

Для заголовка set-cook ie, я думаю, что это схема: COOKIENAME=VALUE; ATTRIBUTE=VALUE; ... ATTRIBUTE; ... ATTRIBUTE

и для заголовка cook ie: COOKIENAME=VALUE; .... COOKIENAME=VALUE

Я пытаюсь сделайте регулярное выражение, представляющее эту схему:

((.+)=(.*)(((; (path|domain|samesite|Max-Age|expires)=(.*))*)|(; (httponly|secure))),?)

и выполните их:

import re

str = "PE_SESSION=846e62055890a5376ab62; path=/; domain=www.provenexpert.com, _pelocale=bG9jYWxlfGVffffg%3D%3D; expires=Sat, 08-Feb-2020 00:17:36 GMT; Max-Age=2592000; path=/; domain=www.provenexpert.com, _pelocale=bGfffH4%3D; expires=Thu, 09-Jan-2020 00:17:35 GMT; Max-Age=0; path=/, _pelocale=bGfffH4%3D; expires=Thu, 09-Jan-2020 00:17:35 GMT; Max-Age=0; path=/; domain=www.provenexpert.com, PE_SESSION=deleted; expires=Thu, 01-Jan-1970 00:00:01 GMT; Max-Age=0; path=/, PE_SESSION=deleted; expires=Thu, 01-Jan-1970 00:00:01 GMT; Max-Age=0; path=/; domain=www.provenexpert.com"

regex = re.compile("((.+)=(.*)(((; (path|domain|samesite|Max-Age|expires)=(.*))*)|(; (httponly|secure))),?)")
result = regex.search(str)

, но это не даст мне имена повара ie или что-то еще.

Я думаю, что мне нужна помощь для правильного построения регулярных выражений ...

...