Как я могу удалить кортеж из моего корпуса TF-IDF? - PullRequest
0 голосов
/ 11 декабря 2019

У меня есть этот код

из моделей импорта gensim. Импорт numpy как np

Создание модели TF-IDF tfidf = models.TfidfModel(corpus, smartirs = "ntc)

Показать веса TF-IDF для документа в tfidf [корпусе]: print ([[словарь [id], np.around (freq, десятичные дроби)= 7)] для id, freq in doc])

Тогда у меня есть этот результат

[['brocolli', 0.5491093], ['brother',0.1237955], ['but', 0.1237955], ['eat', 0.568619], ['good', 0.3660728], ['like', 0.2843095], ['not', 0.1830364], ['rata', 0.1237955], ['saluut', 0.2843095]] [['brother', 0.1647724], ['rata', 0.1647724], ['around', 0.3784174], ['basebal', 0.3784174], ['drive', 0.1647724],['lot', 0.3784174], ['mother', 0.2436224], ['Practic', 0.3784174], ['провести', 0.3784174], ['time', 0.3784174]] enter code here [['rata', 0.1335974], ['drive', 0.1335974], ['and', 0.3068207], ['blood', 0.3068207], ['caus', 0.3068207], ['expert', 0.3068207], ['health', 0.197529],['Increas', 0,3068207], ['may', 0.3068207], ['pressur', 0.197529], ['some', 0.3068207], ['offer', 0.3068207], ['tension ', 0.3068207], [' that ', 0.197529]]

Я хочу удалить все кортежи <0.2 Например, слово «DRIVE» = 0.1335 Я хочу удалить этот кортеж. Как я могу это сделать? </p>

...