HTTP нечувствительный к регистру пользовательский агент разбирает python - PullRequest
0 голосов
/ 05 мая 2019

Я анализирую пользовательский агент HTTP. User_agents в нижнем регистре, который парсер не может определить. Я пробовал пакеты Python, такие как user_agents, user_agent_plus и httpagentparser. Тем не менее, это действительные URL. Я пытался использовать заглавные буквы (), которые не работали, для таких терминов, как "KHTML", "CPU" и т. Д.

from user_agents import parse
# iPhone's user agent string
ua_string = 'mozilla/5.0 (ipad; cpu os 11_2 like mac os x) 
applewebkit/604.4.7 (khtml, like gecko) version/11.0 mobile/15c114 
safari/604.1'

user_agent = parse(ua_string)

# Accessing user agent's browser attributes
user_agent.browser  # returns Browser(family=u'Mobile Safari', version= (5, 1), version_string='5.1')
user_agent.browser.family  # returns 'Mobile Safari'
user_agent.browser.version  # returns (5, 1)
user_agent.browser.version_string   # returns '5.1'

# Accessing user agent's operating system properties
user_agent.os  # returns OperatingSystem(family=u'iOS', version=(5, 1), version_string='5.1')
user_agent.os.family  # returns 'iOS'
user_agent.os.version  # returns (5, 1)
user_agent.os.version_string  # returns '5.1'

# Accessing user agent's device properties
user_agent.device  # returns Device(family=u'iPhone', brand=u'Apple', model=u'iPhone')
user_agent.device.family  # returns 'iPhone'
user_agent.device.brand # returns 'Apple'
user_agent.device.model # returns 'iPhone'

# Viewing a pretty string version
str(user_agent) # returns "iPhone / iOS 5.1 / Mobile Safari 5.1"

Это возвращает следующее, что неправильно обрабатывает user-agent.

'Other / Other / Other'

Любая помощь будет по достоинству оценена.

...