Я сканирую список URL-адресов из CSV-файла, извлекаю информацию о кадре данных из каждого URL-адреса и экспортирую его в CSV-файл.он останавливается, когда попадает на страницу, на которой нет информации.Я хочу удалить URL-адреса из первого файла (они содержат номер лицензии), который я уже просканировал на основе номеров лицензий, которые я собрал из второго файла.Я могу легко сделать это в Excel, используя вспомогательную колонку, но понятия не имею, как это сделать с пандами.
например: я хочу удалить первые 2 строки (URL) в file1 на основе Lic # в file2.
File1(no headers)
www.1234.com
www.1235.com
www.1236.com
File2(LIC# is the header)
1234
1235
new urls (expected output back into File1)
www.1236
Я просмотрел здесь много примеров, и мне не удается обернуть его вокруг.
Я ценю любые комментарии и / или предложения.