Python использует цикл для запуска функции и добавления данных в фрейм - PullRequest
0 голосов
/ 10 марта 2019

Я сделал функцию, которая извлекает имя и адрес из координат и генерирует фрейм данных.Это работает для одной записи.

def get_data(lat, lng):
    try:
        date = '2019-03-09'
        res = requests.get('https://www.imax.com/showtimes/ajax/theatres?date=' + date + '&lat=' + str(lat) + '&lon=' + str(lng))
        soup = bs(res.content, 'lxml')
        newData = json.loads(soup.select_one('p').text)
        columns = ['theatreLink', 'theatrename', 'address']
        baseURL = 'https://www.imax.com'
        results = []
        for row in newData['rows']:
            soup = bs(row['row'], 'lxml')
            link = baseURL + soup.select_one('a')['href']
            name = soup.select_one('.theatre-title').text.strip()
            address = soup.select_one('.theatre-address').text.strip()
            results.append([link, name, address])
        df = pd.DataFrame(results, columns = columns)
        return df
    except:
        print (error)
get_data(us['lat'][2], us['lng'][2])

Это приводит к:

enter image description here

Я пытаюсь использовать цикл for,который может передавать несколько координат и генерировать результаты, помещенные в один кадр данных.Например, продолжайте добавлять результаты из каждой координаты к предыдущему фрейму данных.

Я попробовал следующий код:

for i in range(len(us)):
    lat=us['lat']
    lng=us['lng']
    df.append(get_data(lat[i], lng[i]))
    df_all.append(df)

Но он дает мне следующую ошибку:

enter image description here

Ответы [ 2 ]

0 голосов
/ 10 марта 2019

Подумайте о создании списка фреймов данных из списка, а затем объедините все элементы вместе. Ниже предполагается, что us - это фрейм данных с двумя итерационными эквивалентами:

df_list = [get_data(row['lat'], row['lng']) for idx,row in us.iterrows()]
# df_list =  [get_data(row.lat, row.lng) for row in us.itertuples()]

final_df = pd.concat(df_list, ignore_index=True)
0 голосов
/ 10 марта 2019

Вы должны сделать следующее.

result = []
lat=us['lat']
lng = us['ing']    
for i in range(len(us)):
    result.append(get_data(lat[i], ing[i]))
pd.DataFrame(result, columns =columns ) 

В моем примере вы должны изменить get_data, чтобы он возвращал список вместо DF.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...