У меня есть рабочий python код для извлечения заголовка газетной статьи с использованием пакета Newspaper
. Тем не менее, это для одного URL. У меня есть CSV-файл со столбцом из 100 или около того URL-адресов, из которых я хотел бы извлечь Newspaper
. Как переместить мой рабочий код из одной строки URL в URL в CSV и добавить заголовок в качестве нового столбца там?
# working code
from newspaper import Article
url = 'https://www.nytimes.com/2019/11/06/magazine/the-crown-peter-morgan.html'
article = Article(url)
article.download()
article.parse()
article.title
print(article.title)
Я попытался (безуспешно) после нескольких часов чтения ответов на SOF и в других местах:
# non-working code
# to get the title of an article
from newspaper import Article
import pandas as pd
data = pd.read_csv('/Users/user/Desktop/pythonsample.csv')
for x in data['expanded']:
article = Article(x, language='en') # x is the url in each row of the column
try:
article.download()
except:
continue
try:
article.parse()
except:
continue
else:
title = article.title
print(title)
Любая помощь.