Проблемы с удалением первого и последнего символа из URL-адресов в CSV - PullRequest
0 голосов
/ 29 мая 2020

Я получаю следующую ошибку при использовании requests requests.exceptions.InvalidSchema: No connection adapters were found for '[' https://www.example.com/contact/find .. ']'. Итак, есть эти две фигурные скобки в начале и в конце ссылок, которые я читаю из файла csv. Эти фигурные скобки попадают туда из-за этого оператора links_total.append('https://www.example.com'+cell_link['href']). Я пытаюсь разрезать строку до requests. Не работает. Я использовал row = row[1:-1], что дает следующую ошибку requests.exceptions.InvalidURL: Failed to parse: []. Я бы хотел удалить эти фигурные скобки.

try:
    with open('rt.csv', 'r') as read_obj:
      csv_reader = reader(read_obj)
      for row in csv_reader:
        row = row[1:-1]
        page2 = requests.get(row)

Эта строка взята из программы, которую я использовал для очистки этих ссылок на файл csv. links_total.append('https://www.example.com'+cell_link['href'])

Ответы [ 2 ]

0 голосов
/ 29 мая 2020

Я просто попробовал с row = row[-1], и это сработало.

0 голосов
/ 29 мая 2020

Попробуйте использовать модуль re, проверьте документацию re модуль

...