Людвиг, когда использовать функцию SET, функцию SEQUENCE, примеры данных для обоих - PullRequest
0 голосов
/ 11 июля 2019

Как определить, когда использовать Set Features против Sequence Features в столбце и разницу между ними с некоторыми примерами.

Я пытаюсь использовать Людвиг для выполнения классификации.Мой набор данных выглядит примерно так:

  • Буквы здесь только для ознакомительных целей
  • Например, функция 1 (буквенное слово) может обозначать ^ al lph pha ha $ (триграмма здесь)
LABEL, Feature1, Feature2
X,     A B C,    D A E
X,     B C K,    K J L
Y,     A D C,    D A E
Y,     B D E,    J L R

        name: Feature1_trigrams
        type: set
        level: words
        encoder:
          representation: dense
          embedding_size: 10
          embeddings_on_cpu: false
          pretrained_embeddings: null
          embeddings_trainable: true
          dropout: false
          initializer: null
          regularize: true
          reduce_output: sqrt
          tied_weights: null
        cell_type: lstm
        bidirectional: true
        num_layers: 2
        reduce_output: null
        preprocessing:
          format: space

Должен ли я вместо этого использовать последовательность?

...