Объединить значения в серии Panda - PullRequest
0 голосов
/ 07 марта 2020

У меня есть следующий ответ на запрос API:

    <movies>
    <movie>
    <rating>5</rating>
    <name>star wars</name>
    </movie>
    <movie>
    <rating>8</rating>
    <name>jurassic park</name>
    </movie>
    </movies>

Есть ли способ получить эту информацию и получить значения рейтинга и имени и сохранить их внутри серии в Pandas?

Конечный результат будет выглядеть так:

      Movie Rating  
     5 - star Wars  
 8 - Jurassic park    

Вы заметите, что я взял все значения, найденные в моем ответе, и добавил их в один столбец. Я искал, чтобы добавить, например, 5 объединений '-' и звездные войны.

1 Ответ

1 голос
/ 07 марта 2020

Это то, что вы ищете? Я объяснил шаг за шагом в коде. Была одна часть, которую я не знал, как сделать, но я исследовал и понял это.

import pandas as pd
import numpy as np
df = pd.DataFrame({'Data' : ['<movies>','<movie>','<rating>5</rating>',
                             '<name>star wars</name>', '</movie>', 
                             '<rating>8</rating>', '<name>jurassic park</name>', 
                             '</movie>', '</movies>']})
#Filter for the relevant rows of data based upon the logic of the pattern. I have also 
#done an optional reset of the index.
df = df.loc[df['Data'].str.contains('>.*<', regex=True)].reset_index(drop=True)
#For the rows we just filtered for, get rid of the irrelevant data with some regex 
#string manipulation
df['Data'] = df['Data'].str.findall('>.*<').str[0].replace(['>','<'], '', regex=True)
#Use join with shift and add_suffix CREDIT to @joelostblom:
#https://stackoverflow.com/questions/47450259/merge-row-with-next-row-in-dataframe- 
#pandas
df = df.add_suffix('1').join(df.shift(-1).add_suffix('2'))
#Filter for numeric rows only
df = df.loc[df['Data1'].str.isnumeric() == True]
#Combine Columns with desired format
df['Movie Rating'] = df['Data1'] + ' - ' + df['Data2']
#Filter for only relevant column and print dataframe
df = df[['Movie Rating']]
print(df)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...