У меня есть текстовый файл, содержащий несколько веб-сайтов.
text = '"wadouri:https:\/\/dev.pluginslab.com\/dicomviewer\/wp-content\/plugins\/pl-dicom-viewer-amazon-s3\/assets\/cases\/8255\/20191209113141\/sagittal-00000001.dcm","wadouri:https:\/\/dev.pluginslab.com\/dicomviewer\/wp-content\/plugins\/pl-dicom-viewer-amazon-s3\/assets\/cases\/8255\/20191209113141\/sagittal-00000002.dcm","wadouri:https:\/\/dev.pluginslab.com\/dicomviewer\/wp-content\/plugins\/pl-dicom-viewer-amazon-s3\/assets\/cases\/8255\/20191209113141\/sagittal-00000003.dcm", etc'
Мне удалось извлечь каждый веб-сайт в список
Однако в моем списке есть символ '/' Кажется, я не могу удалить.
Может кто-нибудь сказать мне, где я ошибся
Спасибо
import re
import bs4 as bs
import urllib.request
import os
myfile = open('C:/test/test.txt', 'r')
regex = re.compile(r'(?<=https).*?(?=dcm)')
dcm =[]
for line in myfile:
matches = regex.findall(line)
for m in matches:
dcm.append (str('https' + m + 'dcm'))
for d in dcm:
d.replace('/','')
print(d)