Как получить показатели читабельности, такие как индекс смога или легкость чтения целого столбца в кадре данных? - PullRequest
0 голосов
/ 09 июля 2019

У меня есть набор данных, и в одном из столбцов есть строки, т. Е. comments, которые были предварительно обработаны, но у меня возникают трудности с получением одного показателя читабельности для текста во всем столбце, который я сейчас получаю по строкам оценка читаемости.

Я попытался преобразовать весь столбец в строке, а затем с помощью texttat получить показатель читабельности

'' '

    import textstat

    data["new"] = data["comments"]

    data['new'] = data.to_string(columns = ['new'])

    mess = data["new"]

    def text_proces(mess):


    score1 = textstat.flesch_reading_ease(mess)

    score = textstat.automated_readability_index(mess)

    print(score1)

    print(score)


    print(data["comments"].apply(text_proces))  

'' '

ВЫХОД Я ПОЛУЧУ

'' '

    score1

    7.3

    score

    10.1

    score1

    6.6

    score

    7.4

    0    None
    1    None
    2    None
    3    None
    4    None

''» Кроме того, я не знаю, что означает none в выводе

ОЖИДАЕТСЯ: только две или более уникальных оценки для всего столбца «комментарии»

'' '

   score1 = 89.3

   score = 35.4

'' '

...