Как реализовать встраивание слов Spacy в набор данных - PullRequest
0 голосов
/ 11 января 2019

У меня есть набор данных, который выглядит следующим образом

[[(Sky proposal, is, matter), (Sky proposal, is, Mays spokesman)], [(Women, 
lag, Intel report)], [(Amazon, expected, to unveil)], [(Goldman Sachs, raising, 
billion)], [(MHP, opens, books)], [(Disney, hurls, magic), (Disney, hurls, 
moolah)], [(Amazon, offering, loans), (Amazon, offering, to)], [(JPMorgan, 
seeks, billion), (JPMorgan, seeks, WaMu claims)], [(Comcast, accuses, 
Discovery)], [(Boeing, sees, sales)], [(BRIEFNetflix Inc, reports, earnings)], 
[(Broadcom deal, may stunt, Valley investment)], [(Apple, sell, iPads)], [(oil, 
pull, Street)], [(Fed, tells, Goldman), (Fed, tells, to improve)], [(ideas, 
undermine, Brexit), (ideas, undermine, Facebook)], [(FX DEBTC, hits, low), 
(tumbles investors, buy, greenbacks)], [(BRIEFWells Fargo, announces, plan)], 
[(Red Hat, jumps, IBM shares dip)], [(Nasdaqs tech focus, helps, drive)], 
[(Amazon, offers, music service)], [(EXCLUSIVEFormer risk chief, warned, 
Bank)], ...

Я пытаюсь преобразовать каждый кортеж в векторное пространство (вложение слов) с помощью Spacy, однако я изо всех сил пытаюсь найти реализацию, которая может выполнять итерацию и предоставлять векторный вывод каждого кортежа

Я пытаюсь использовать некоторую функцию со следующим

import Spacy
doc = nlp("NLP project test")
doc.vector
...