Чтение XML-файла в пандах - PullRequest
0 голосов
/ 24 ноября 2018

У меня есть XML-файл, я хочу загрузить его в pandas, я пробовал другие XML-файлы, но для этого форма неясна, и каждый раз, когда это выдает ошибку, и я не придумываю кадр данных Pandas Iнеобходимость.Любые предложения -

-<tweet id="591154373696323584">
Diga cuanto nos van a costar las 
<sentiment polarity="N" entity="Partido_Popular" aspect="Economia">autovías</sentiment>
de sus amiguetes ¿4500 millones o más ? @EsperanzAguirre @PPopular
</tweet>


-<tweet id="591154532362670080">
@lhermoso_ @sanchezcastejon 
<sentiment polarity="N" entity="Partido_Socialista_Obrero_Espanol" aspect="Propio_partido">#DobleMoral</sentiment>
 Castilla antes que Aragón...
</tweet>

Я использую код ниже.

import xml.etree.cElementTree as et
import pandas as pd

def getvalueofnode(node):
    """ return node text or None """
    return node.text if node is not None else None

def main():
    parsed_xml = et.parse("stompol-train-tagged.xml")
    dfcols = ['tweet id', 'tweet', 'sentiment_polarity', 'entity', 'aspect', 'sentiment']
    df_xml = pd.DataFrame(columns=dfcols)

    for node in parsed_xml.getroot():
        tweetid = node.attrib.get('tweetid')
        tweet = node.find('tweet')
        sentiment_polarity = node.find('polarity')
        entity = node.find('entity')
        aspect = node.find('aspect')
        sentiment = node.find('sentiment')


        df_xml = df_xml.append(
            pd.Series([tweetid, tweet, sentiment_polarity, entity, aspect, sentiment], index=dfcols),
            ignore_index=True)

    print(df_xml)

main()

Я получаю None и все.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...