Question

Я хочу

Извлечь название страны из HTML файла
Я сделал текстовый файл из HTML источника

Что я пробовал

https://www.flightsfrom.com/WUH/destinations
Я написал код ниже

import re

f = open('/Users/User/Programming/plotly.csv/country_name.txt')
data1 = f.read()
print(re.findall('data_country\=(\".+\")', data1))
print(re.findall('a(.*)b', 'axyzb'))

TXT файл выглядит так:

Но код просто дает мне такой результат:

I думаю, что это проблема с регулярным выражением.

XTJP · Answer 1 · 06 февраля 2020

print(re.findall('data-country\=(\".+?\")', data1)) было именно то, что мне нужно.

print(re.findall('data-country\=(\".+\")', data1)) дал мне слишком длинные тексты, которые я не искал.

Я не буду делать снимок экрана в следующий раз. Вместо этого я скопирую и напишу коды. Спасибо, что сообщили мне.

Как извлечь текст с помощью re.findall?

Я хочу

Что я пробовал

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как извлечь текст с помощью re.findall?

Я хочу

Что я пробовал

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов