Добавление столбца с использованием urllib.parse - PullRequest
0 голосов
/ 21 мая 2018

У меня есть CSV, импортированный с помощью Pandas:

df = pd.read_csv('files_2.csv')

Один из столбцов в данных - это PAGE URL, я хотел бы добавить столбец во фрейм данных с функциями, выполняемыми с помощью urlib

примерно так:

o = urlparse(df['Page URL'])
o.query #function that pull the data 
parse_qs(o.query) # the logic for the column

Новый столбец должен содержать результаты функции parse_qs (o.query).Я новичок в использовании Python 3, и было бы здорово, если бы вы указали мне правильное направление.

Спасибо

Ответы [ 2 ]

0 голосов
/ 21 мая 2018

Использование apply

Пример:

import pandas as pd
from urlparse import urlparse, parse_qs
df = pd.DataFrame({"Page URL": ["https://www.google.com/search?ei=0kkkk"]})
df['query'] = df['Page URL'].apply(urlparse).apply(lambda x: parse_qs(x.query))
print(df)

Выход:

                                 Page URL                query
0  https://www.google.com/search?ei=0kkkk  {u'ei': [u'0kkkk']}
0 голосов
/ 21 мая 2018

Попробуйте выполнить следующее:

page_url = urlparse(df['Page URL'])
df['query'] = parse_qs(page_url.query)

Помните, что parse_qs() возвращает словарь, поэтому у вас будут словари в ваших клетках query.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...