Ну, потратив некоторое время и усилия, я узнал некоторые причины, почему это происходит. Итак, я отвечаю на свой вопрос, потому что это может помочь кому-то еще.
Итак, pgid (Process GroupID) и sid (Session ID) были добавлены самим сервером. Когда я вижу через DOM в моем браузере. Мой браузер уже обработал его, и там я не смог увидеть sid и pgid в ссылках. Но когда я получаю html, используя python, тогда ссылки приходят в формате url + sid + pgid. Причина указана в этой документации Scrapy
Я использовал
element.xpath("/a/@href").split(";")[0]
, чтобы получить только URL и удалить sid и pgid из ссылок. Это не полное решение xpath. Но это решило мою проблему.