Какой режим обучения Starspace использовать для многоуровневых вложений - PullRequest
0 голосов
/ 16 февраля 2020

Я впервые использую фреймворк для встраивания StarSpace, и мне неясно, какие "режимы" он предоставляет для обучения и чем они отличаются.

Доступны следующие варианты:

  • пространство слов
  • предложения
  • пространство статей
  • пространство тегов
  • пространство документов
  • пространство страниц
  • entityrelationspace / graphspace

Допустим, у меня есть набор данных, который выглядит следующим образом:

| Author | City   | Tweet_ID  | Tweet_contents                     | 
|:-------|:-------|:----------|:-----------------------------------| 
| A      | NYC    | 1         | "This is usually a short sentence" | 
| A      | LONDON | 2         | "Another short sentence"           | 
| B      | PARIS  | 3         | "Check out this cool track"        | 
| B      | BERLIN | 4         | "I like turtles"                   | 
| C      | PARIS  | 5         | "It was a dark and stormy night"   | 
| ...    | ...    | ...       | ...                                |

(На самом деле мой набор данных не является языковыми данными и не выглядит так, но этот пример хорошо демонстрирует эту точку зрения). достаточно.)

Я хотел бы одновременно создавать вложения с нуля (не используя ранее существующие вложения в любой точке) для каждого из следующих действий:

  • Авторы
  • Города
  • Чирикать / Предложения / Документы (EG. 1, 2, 3, 4, 5, et c.)
  • Words (EG. 'This ',' is ',' обычно ', ...,' бурный ',' ночь 'и др. c.)

Даже после прочтения Судя по всему, не совсем понятно, какой «режим» обучения звездному пространству я должен использовать.

Если кто-нибудь может помочь мне понять, как интерпретировать режимы, чтобы помочь выбрать подходящий, это было бы очень полезно.

Я также хотел бы знать, существуют ли условия, при которых вложения, созданные с использованием одного из указанных выше режимов, в некотором роде будут эквивалентны вложениям, построенным с использованием другого режима (игнорируя тот факт, что вложения будут отличаться из-за неопределенности c характера процесса.)

Спасибо

...