Как разобрать строку html, используя python scrapy - PullRequest
0 голосов
/ 17 апреля 2020

У меня есть список html элементов ввода, как показано ниже.

lists=[<input type="hidden" name="csrf_token" value="jZdkrMumEBeXQlUTbOWfInDwNhtVHGSxKyPvaipoAFsYqCgRLJzc">,
<input type="text" class="form-control" id="username" name="username">,
<input type="password" class="form-control" id="password" name="password">,
<input type="submit" value="Login" class="btn btn-primary">]

Из них мне нужно извлечь значения атрибутов name , type и значение

Например: рассмотрим ввод <input type="hidden" name="csrf_token" value="jZdkrMumEBeXQlUTbOWfInDwNhtVHGSxKyPvaipoAFsYqCgRLJzc">, тогда мне нужен вывод в следующем формате словаря {'csrf_token' :( 'hidden', "jZdkrMumEBeXQlUTbOWfInDwNhtVHGSxKyPvaipoAFsYqva *oJJ *)")

Может кто-нибудь, пожалуйста, руководство для решения этой проблемы

1 Ответ

1 голос
/ 17 апреля 2020

Я рекомендую вам использовать библиотеку Beautiful Soup Python (https://pypi.org/project/beautifulsoup4/), чтобы получить содержимое HTML и значения элементов. Для этой цели уже созданы функции.

...