Обновите столбец с данными FOR LOOP Pandas - PullRequest
1 голос
/ 22 октября 2019

У меня есть код ниже, мне нужно, чтобы выходные данные печати обновляли новый столбец.

import pandas as pd
import re
import numpy as np
import urllib.parse
from urllib.request import urlopen
import requests
from bs4 import BeautifulSoup
df = pd.read_csv('IR006.csv')
pd.set_option('display.max_colwidth', -1)

df4 = pd.read_csv('IR006.csv')
df4['UPDATE'] = "" **#This is the column where i wanna see the output of the for loop**

Итак, вот цикл, который извлекает данные из URL ----

for link in df4.iterrows():
    url = link[1]['URL'].replace('/v01/', '/depot/')
    x = urlopen(url)
    new = x.read()
    soup = BeautifulSoup(new, "lxml-xml")
    match = ''.join(re.findall(r"[C][L]\S{8}", str(soup)))
    print(match)

output:

CLdbDQgFdD
CLYwHQYDVR

CLYwHQYDVR
CLYwHQYDVR

CLYwHQYDVR

Dataframe выглядит следующим образом: DATAFRAME , так как я могу поместить данные, которые генерируют цикл, в новое имя столбца «UPDATE»

1 Ответ

0 голосов
/ 22 октября 2019

Попробуйте следующий код:

for idx,row in df4.iterrows():
    url = row['URL'].replace('/v01/', '/depot/')
    x = urlopen(url)
    new = x.read()
    soup = BeautifulSoup(new, "lxml-xml")
    match = ''.join(re.findall(r"[C][L]\S{8}", str(soup)))
    df4.at[idx,'UPDATE'] = match
...