Определение языка является частным случаем классификации текста с использованием контролируемых моделей ( здесь вы можете найти учебное пособие ).
В соответствии с учебным пособием вы можете прогнозировать новые примеры, набрав:
./fasttext predict-prob langdetect.bin - -1 0.5
(мы хотим максимально возможное количество предсказаний (аргумент -1), и нам нужны только метки с вероятностью выше или равной 0,5)
и затем введите предложение.
Если у вас есть текстовый файл с предложениями для классификации, вы можете набрать:
$ ./fasttext predict-prob langdetect.bin test.txt k
, где k - это числоклассы для показа.
Этот шпаргалка также может быть полезен.