Я впервые использую фреймворк для встраивания StarSpace, и мне неясно, какие "режимы" он предоставляет для обучения и чем они отличаются.
Доступны следующие варианты:
- пространство слов
- предложения
- пространство статей
- пространство тегов
- пространство документов
- пространство страниц
- entityrelationspace / graphspace
Допустим, у меня есть набор данных, который выглядит следующим образом:
| Author | City | Tweet_ID | Tweet_contents |
|:-------|:-------|:----------|:-----------------------------------|
| A | NYC | 1 | "This is usually a short sentence" |
| A | LONDON | 2 | "Another short sentence" |
| B | PARIS | 3 | "Check out this cool track" |
| B | BERLIN | 4 | "I like turtles" |
| C | PARIS | 5 | "It was a dark and stormy night" |
| ... | ... | ... | ... |
(На самом деле мой набор данных не является языковыми данными и не выглядит так, но этот пример хорошо демонстрирует эту точку зрения). достаточно.)
Я хотел бы одновременно создавать вложения с нуля (не используя ранее существующие вложения в любой точке) для каждого из следующих действий:
- Авторы
- Города
- Чирикать / Предложения / Документы (EG. 1, 2, 3, 4, 5, et c.)
- Words (EG. 'This ',' is ',' обычно ', ...,' бурный ',' ночь 'и др. c.)
Даже после прочтения Судя по всему, не совсем понятно, какой «режим» обучения звездному пространству я должен использовать.
Если кто-нибудь может помочь мне понять, как интерпретировать режимы, чтобы помочь выбрать подходящий, это было бы очень полезно.
Я также хотел бы знать, существуют ли условия, при которых вложения, созданные с использованием одного из указанных выше режимов, в некотором роде будут эквивалентны вложениям, построенным с использованием другого режима (игнорируя тот факт, что вложения будут отличаться из-за неопределенности c характера процесса.)
Спасибо