Я хочу вызвать значения счетчиков внутри панд.
Усилие на данный момент:
from __future__ import unicode_literals
import spacy,en_core_web_sm
from collections import Counter
import pandas as pd
nlp = en_core_web_sm.load()
c = Counter(([token.pos_ for token in nlp('The cat sat on the mat.')]))
sbase = sum(c.values())
for el, cnt in c.items():
el, '{0:2.2f}%'.format((100.0* cnt)/sbase)
df = pd.DataFrame.from_dict(c, orient='index').reset_index()
print df
Токовый выход:
index 0
0 NOUN 2
1 VERB 1
2 DET 2
3 ADP 1
4 PUNCT 1
Ожидаемый результат:
Ниже в кадре данных:
(u'NOUN', u'28.57%')
(u'VERB', u'14.29%')
(u'DET', u'28.57%')
(u'ADP', u'14.29%')
(u'PUNCT', u'14.29%')
Я хочу вызвать el и cnt внутри фрейма данных как?
Это был следующий вопрос, в котором я хотел получить процентную долю распределения POS в списке.
Глагол в процентах, существительное, использующее Spacy?
Я понял, что мне нужно поставить группу el и cnt вместо c ниже:
df = pd.DataFrame.from_dict (c, orient = 'index'). Reset_index ()