запустить langdetect каждую строку файла - PullRequest
0 голосов
/ 28 апреля 2020

Прежде всего, извините за очень простой c вопрос, возможно.

У меня есть текстовый файл, подобный этому:

Abwehr
Abzweigung
ac
Acciughe
ACDR
Aceituna
acetamidobenzoico
Aceto
Achaia
Acharuli
Achladea
Achladochori
Acipenser

Где я запускаю это, чтобы обнаружить язык каждой строки:

import os, sys, fileinput
from langdetect import detect

for line in fileinput.input():
    print(detect(u'line') + ": " + line),

, но он всегда печатает один и тот же язык перед текстом.

et: Abwehr
et: Abzweigung
et: ac
et: Acciughe
et: ACDR
et: Aceituna
et: acetamidobenzoico
et: Aceto
et: Achaia
et: Acharuli
et: Achladea
et: Achladochori
et: Acipenser

Я понимаю, что он всегда должен указывать на один и тот же результат (первый / последний?), но как мне перебрать часть "langdetect" и вывести соответствующий lang для каждой строки?

1 Ответ

0 голосов
/ 28 апреля 2020

Вы передаете буквальную "line" строку - вам нужно просто передать переменную строку:

print(detect(line) + ": " + line)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...