Есть ли польская реализация для похожих слов в word2vec? - PullRequest
0 голосов
/ 08 ноября 2019

Я нашел библиотеку GoogleNews-vectors-positive300.bin, но только для английских слов. Есть ли польская реализация для похожих слов в word2vec?

Я уже пробовал использовать cc.pl.300.bin иNKJP-PodkorpusMilionowy библиотеки ...

    public  Word2Vec getWord2Vec() {
        File gModel = new File("C:/Users/user/Desktop/GoogleNews-vectors-negative300.bin.gz");
        return WordVectorSerializer.readWord2VecModel(gModel);
    }

1 Ответ

1 голос
/ 09 ноября 2019

Файл ...

https://dl.fbaipublicfiles.com/fasttext/vectors-wiki/wiki.pl.vec

... в виде ссылки с ...

https://fasttext.cc/docs/en/pretrained-vectors.html

... может работать для вас, если ваша библиотека загружает простой «текстовый» формат для обмена слово-векторами. (Это не в бинарном формате Facebook FastText, как ваш файл cc.pl.300.bin.)

...