Использование Google Векторов в Watson Studio - PullRequest
0 голосов
/ 04 марта 2019

Я использовал Watson Studio для некоторых базовых курсовых работ;Можно ли загружать векторы Google Word в двоичном виде (.bin) в Watson Studio?

1 Ответ

0 голосов
/ 05 марта 2019

Конечно, вы можете читать файлы в двоичном формате и технически файлы любого типа в ноутбуке watson studio.

Прежде всего, вам нужно загрузить двоичный zip-файл из GoogleNews-vectors-positive300.bin.gz вАктив данных студии Watson, вы можете перетащить в раздел файлов.Как только это будет сделано, вы можете использовать project-lib для чтения этого файла в двоичный объект.

  1. вставить маркер проекта, пожалуйста, обратитесь к документации ниже.

  2. файл извлечения

    my_file = project.get_file("GoogleNews-vectors-negative300.bin.gz")

  3. , поскольку это gzip, вам нужно использовать gzip

    import gzip

    gzip_f = gzip.GzipFile(fileobj=my_file)

  4. установить gensim !pip install gensim

  5. импортировать genism и загрузить модель

import gensim

    # Load Google's pre-trained Word2Vec model.
    model = gensim.models.KeyedVectors.load_word2vec_format(gzip_f,binary=True)  

Ссылка: - https://dataplatform.cloud.ibm.com/docs/content/wsj/analyze-data/project-lib-python.html?audience=wdp

Полный блокнот: - https://dataplatform.cloud.ibm.com/analytics/notebooks/v2/3ea58eda-cd56-4f7a-8b73-707d4b84edb2/view?access_token=cdfedfc282a7fc98691a1e7c5c183eeac607a7d1e09656dff448c6989e52eb5a

...