Использование URL-адресов в столбце csv в качестве входных данных `Newspaper` и добавление функции добавления для нового столбца в том же файле csv - PullRequest
0 голосов
/ 02 февраля 2020

У меня есть рабочий python код для извлечения заголовка газетной статьи с использованием пакета Newspaper. Тем не менее, это для одного URL. У меня есть CSV-файл со столбцом из 100 или около того URL-адресов, из которых я хотел бы извлечь Newspaper. Как переместить мой рабочий код из одной строки URL в URL в CSV и добавить заголовок в качестве нового столбца там?

# working code

from newspaper import Article
url = 'https://www.nytimes.com/2019/11/06/magazine/the-crown-peter-morgan.html'
article = Article(url)
article.download()
article.parse()
article.title

print(article.title)

Я попытался (безуспешно) после нескольких часов чтения ответов на SOF и в других местах:

# non-working code
# to get the title of an article 

from newspaper import Article

import pandas as pd

data = pd.read_csv('/Users/user/Desktop/pythonsample.csv')


for x in data['expanded']: 
    article = Article(x, language='en') # x is the url in each row of the column

    try:
        article.download()
    except:
        continue

    try:
        article.parse()
    except:
        continue
    else:

         title = article.title

    print(title)

Любая помощь.

...