разделение URL и получение значений из этого URl в столбцах - PullRequest
0 голосов
/ 28 октября 2018

Привет, скажем, у меня есть столбец в представлении имени фрейма данных, который содержит - m https://ckd.pdc.com/pdc/73ba5189-94fd-44aa-88d3-6b36aaa69b02/DDA1610095.zip

Я хочу, чтобы в одном столбце было указано Zest, и я хочу, чтобы в этом столбце было значение DDA1610095.

и новый столбецв этом столбце скажите «type and want .zip», как это сделать с помощью панд.

Ответы [ 2 ]

0 голосов
/ 28 октября 2018

попробуйте использовать str.split и добавьте еще str, чтобы можно было проиндексировать каждую строку.

data = [{'ID' : '1',
    'URL':  'https://ckd.pdc.com/pdc/73ba5189-94fd-44aa-88d3-6b36aaa69b02/DDA1610095.zip'}]
df = pd.DataFrame(data)



     print(df)
            ID  URL
    0   1   https://ckd.pdc.com/pdc/73ba5189-94fd-44aa-88d...

    #Get the file name and replace zip (probably a more elegant way to do this) 
    df['Zest'] = df.URL.str.split('/').str[-1].str.replace('.zip','')
    #assign the type into the next column. 
    df['Type'] = df.URL.str.split('.').str[-1]
    print(df)

    ID  URL                                                 Zest       Type
0   1   https://ckd.pdc.com/pdc/73ba5189-94fd-44aa-88d...   DDA1610095 zip
0 голосов
/ 28 октября 2018

вы можете использовать str.split для извлечения почтового индекса из URL

df 
                                                                           url
0  mhttps://ckd.pdc.com/pdc/73ba5189-94fd-44aa-88d3-6b36aaa69b02/DDA1610095.zip

df['zip'] = df.url.str.split('/',expand=True).T[0] \
        [df.url.str.split('/',expand=True).T.shape[0]-1]

df.T
Out[46]: 
                                                                                0
url  mhttps://ckd.pdc.com/pdc/73ba5189-94fd-44aa-88d3-6b36aaa69b02/DDA1610095.zip
zip                                                                DDA1610095.zip
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...