Я использовал Watson Studio для некоторых базовых курсовых работ;Можно ли загружать векторы Google Word в двоичном виде (.bin) в Watson Studio?
Конечно, вы можете читать файлы в двоичном формате и технически файлы любого типа в ноутбуке watson studio.
Прежде всего, вам нужно загрузить двоичный zip-файл из GoogleNews-vectors-positive300.bin.gz вАктив данных студии Watson, вы можете перетащить в раздел файлов.Как только это будет сделано, вы можете использовать project-lib для чтения этого файла в двоичный объект.
project-lib
вставить маркер проекта, пожалуйста, обратитесь к документации ниже.
файл извлечения
my_file = project.get_file("GoogleNews-vectors-negative300.bin.gz")
, поскольку это gzip, вам нужно использовать gzip
import gzip
gzip_f = gzip.GzipFile(fileobj=my_file)
установить gensim !pip install gensim
!pip install gensim
import gensim
# Load Google's pre-trained Word2Vec model. model = gensim.models.KeyedVectors.load_word2vec_format(gzip_f,binary=True)
Ссылка: - https://dataplatform.cloud.ibm.com/docs/content/wsj/analyze-data/project-lib-python.html?audience=wdp
Полный блокнот: - https://dataplatform.cloud.ibm.com/analytics/notebooks/v2/3ea58eda-cd56-4f7a-8b73-707d4b84edb2/view?access_token=cdfedfc282a7fc98691a1e7c5c183eeac607a7d1e09656dff448c6989e52eb5a