Продолжить обучение модели FastText - PullRequest
0 голосов
/ 29 августа 2018

Я скачал модель .bin FastText и использую ее с gensim следующим образом:

model = FastText.load_fasttext_format("cc.fr.300.bin")

Я хотел бы продолжить обучение модели, чтобы адаптировать ее к моей области. После проверки FastText's Github и Gensim документация кажется, что не в настоящее время выполнимо от использования предложенной модификации этого человека (еще нет) объединенный).

Я что-то упустил?

Ответы [ 2 ]

0 голосов
/ 08 июля 2019

Вы можете продолжить обучение в некоторых версиях Gensim's fastText (например, v.3.7. *). Вот пример « Загрузка, вывод, продолжение обучения »

from gensim.test.utils import datapath
model = load_facebook_model(datapath("crime-and-punishment.bin"))
sent = [['lord', 'of', 'the', 'rings'], ['lord', 'of', 'the', 'semi-groups']]
model.build_vocab(sent, update=True)
model.train(sentences=sent, total_examples = len(sent), epochs=5)

По какой-то причине gensim.models.fasttext.load_facebook_model() отсутствует в Windows, но существует при установке Mac. Кроме того, можно использовать gensim.models.FastText.load_fasttext_format() для загрузки предварительно обученной модели и продолжения обучения.

Здесь представлены различные предварительно обученные модели и векторы вики-слов (или здесь ).

Другой пример . « Примечание. Как и в случае с Word2Vec, вы можете продолжить обучение своей модели, используя встроенную в Gensim реализацию fastText. »

0 голосов
/ 03 сентября 2018

Официальная реализация FastText в настоящее время не поддерживает это, хотя есть открытый запрос, связанный с этой проблемой, который вы можете найти здесь .

...