У меня есть набор данных, и в одном из столбцов есть строки, т. Е. comments
, которые были предварительно обработаны, но у меня возникают трудности с получением одного показателя читабельности для текста во всем столбце, который я сейчас получаю по строкам оценка читаемости.
Я попытался преобразовать весь столбец в строке, а затем с помощью texttat получить показатель читабельности
'' '
import textstat
data["new"] = data["comments"]
data['new'] = data.to_string(columns = ['new'])
mess = data["new"]
def text_proces(mess):
score1 = textstat.flesch_reading_ease(mess)
score = textstat.automated_readability_index(mess)
print(score1)
print(score)
print(data["comments"].apply(text_proces))
'' '
ВЫХОД Я ПОЛУЧУ
'' '
score1
7.3
score
10.1
score1
6.6
score
7.4
0 None
1 None
2 None
3 None
4 None
''»
Кроме того, я не знаю, что означает none в выводе
ОЖИДАЕТСЯ:
только две или более уникальных оценки для всего столбца «комментарии»
'' '
score1 = 89.3
score = 35.4
'' '