Как преобразовать число нграмм в представление, которое является приемлемым для логистической регрессии, как преобразование в векторы? - PullRequest
1 голос
/ 19 марта 2019

У меня есть набор данных, который состоит из списка нграмм для каждого предложения в наборе данных, подобного этому, и тега для каждого предложения:

n-grams=[['thats', 'just', 'great', 'thats just', 'just great', 'thats just great'], 
       ['i', 'dont', 'thats', 'subscribe', 'just', 'to', 'either', 'i dont', 'dont thats', 'thats subscribe', 'subscribe just', 'just to', 'to either', 'i dont thats', 'dont thats subscribe', 'thats subscribe just'], 
       ['what', 'is', 'that', 'when', 'you', 'do', 'just']]

act_tags=tags['statement','statement','Wh_Question']

Я хочу применить логистическую регрессию к n-граммам как функциям и выводить как теги действий. Как я должен преобразовать входные данные объектов, которые являются n-граммами, в векторизованную форму, приемлемую для логистической регрессии.

...