Как определить, когда использовать Set Features
против Sequence Features
в столбце и разницу между ними с некоторыми примерами.
Я пытаюсь использовать Людвиг для выполнения классификации.Мой набор данных выглядит примерно так:
- Буквы здесь только для ознакомительных целей
- Например, функция 1 (буквенное слово) может обозначать ^ al lph pha ha $ (триграмма здесь)
LABEL, Feature1, Feature2
X, A B C, D A E
X, B C K, K J L
Y, A D C, D A E
Y, B D E, J L R
name: Feature1_trigrams
type: set
level: words
encoder:
representation: dense
embedding_size: 10
embeddings_on_cpu: false
pretrained_embeddings: null
embeddings_trainable: true
dropout: false
initializer: null
regularize: true
reduce_output: sqrt
tied_weights: null
cell_type: lstm
bidirectional: true
num_layers: 2
reduce_output: null
preprocessing:
format: space
Должен ли я вместо этого использовать последовательность?