Это то, о чем говорит девиз библиотеки lxml
"Программирование с помощью libxml2 похоже на захватывающее объятие экзотического незнакомца. Кажется, у него есть потенциал для осуществления ваших самых смелых мечтаний, но есть неприятные ощущенияголос где-то в вашей голове, предупреждающий вас, что вы собираетесь быть облажанным в худшем случае. "(цитата Марка Пилигрима) Марк Пилигрим описывал, в частности, опыт, который программист Python имеет при работе с libxml2.Привязки Python по умолчанию для libxml2 быстрые, захватывающие, мощные, и ваш код может потерпеть неудачу каким-то ужасным образом, о котором вам действительно не нужно беспокоиться при написании кода Python. lxml сочетает мощь libxml2 с простотой использования Python.
Lib2xml в c, как известно, является самым быстрым анализатором.
И оказывается, что scrapy использует библиотеку parsel, которая является оберткой над lxml.
Из scrapy Документация
Scrapy Selectors - это тонкая оболочкавокруг библиотеки parsel;цель этой оболочки - обеспечить лучшую интеграцию с объектами Scrapy Response.
parsel - это автономная библиотека для очистки веб-страниц, которую можно использовать без Scrapy.Он использует библиотеку lxml под капотом и реализует простой API поверх lxml API.Это означает, что селекторы Scrapy очень похожи по скорости и точности синтаксического анализа на lxml.
Так что я думаю, что я должен использовать селекторы Scrapy, потому что это будет проще.