используйте fasttext windows и создайте двоичный файл - PullRequest
1 голос
/ 08 апреля 2020

Я был бы очень благодарен, если бы я мог получить вашу помощь, я хочу использовать fasttext windows 10 (fasttext официально работает с ma c и linux), который я установил на основании этих подсказок

https://subscription.packtpub.com/book/big_data_and_business_intelligence/9781789130997/1/ch01lvl1sec11/installing-fasttext

затем я хочу запустить этот код ниже (train prodigy sesne2ve c)

Я считаю, что на моем компьютере правильно работает fasttext

Я пытался запустить эту

https://github.com/explosion/sense2vec/blob/master/scripts/04_fasttext_train_vectors.py

, но я столкнулся с этой ошибкой

Я использовал эту команду

    !python 04_fasttext_train_vectors.py -c 10 "C:/Users/moha/Documents/Models/Debug/fasttext.dll" "   ../data/output02" "../data/output04"
   [i] Created temporary merged input file
   ..\data\output02\s2v_input.tmp
   [i] Training vectors
   C:/Users/moha/Documents/Models/Debug/fasttext.dll skipgram -thread 10 -input ..\data\output02       \s2v_input.tmp -output ..\data\output04\vectors_w2v_300dim -dim 300 -minn 0 -maxn 0 -minCount 10 -verbose 2
   [+] Deleted temporary input file
   ..\data\output02\s2v_input.tmp

   [x] Failed training vectors

   The system cannot execute the specified program.

, как вы видите, я использовал "fasttext.dll" в качестве двоичного файла

Я думаю, вопрос в том, как я могу собрать fastText, используя команду, эквивалентную "make" в windows? для ма c и Linux инструкция такова:

(

Building fastText using make (preferred)
wget https://github.com/facebookresearch/fastText/archive/v0.9.1.zip
unzip v0.9.1.zip
cd fastText-0.9.1
make

) Это создаст объектные файлы для всех классов, а также основной двоичный быстрый текст. Если вы это сделаете не планируйте использовать общесистемный компилятор по умолчанию, обновите два макроса, определенных в начале файла Makefile (CC и INCLUDES).

Сборка fastText с использованием cmake На данный момент это не является частью выпуска, поэтому вам нужно будет клонировать основную ветвь.

 git clone https://github.com/facebookresearch/fastText.git
cd fastText
mkdir build && cd build && cmake ..
 make && make install

), что делает двоичный файл, который я могу использовать в сценарии, вопрос в том, могу ли я создать этот файл, используя windows?

Ответы [ 2 ]

1 голос
/ 14 апреля 2020

Обновление: я скачал fastext.exe из https://pypi.org/project/fasttext-win/#files и завершил учебный процесс, здесь скриншот

fasttext.exe сделал свое дело

0 голосов
/ 12 апреля 2020

Со мной по-другому, я пытаюсь обучить данные с помощью сценария sense2ve c, но я использовал bin-файл из предварительно обученного вектора, который я скачал ранее:

d:/sense2vec/04_fasttext_train_vectors.py
ℹ Created temporary merged input file
D:\sense2vec\s2v_input.tmp
ℹ Training vectors
D:/fasttext/yahoo_answers.bin skipgram -thread 10 -input D:\sense2vec\s2v_input.tmp -output D:\sense2vec\vectors_w2v_300dim -dim 300 -minn 0 -maxn 0 -minCount 50 -verbose 2
✔ Deleted temporary input file
D:\sense2vec\s2v_input.tmp
✔ Successfully trained vectors
D:/sense2vec/
ℹ Creating vocabulary
D:/fasttext/yahoo_answers.bin dump D:\sense2vec\vectors_w2v_300dim.bin dict > D:\sense2vec\vocab.txt
✔ Successfully created vocabulary file
D:\sense2vec\vocab.txt

В результате получается vocab.txt с файлом 0 кб (пусто)

...