Строковое представление для двоичной классификации в тензорном потоке - PullRequest
0 голосов
/ 19 ноября 2018

Я делаю простой классификатор, чтобы различать строки как хеши / не хэши:

  1. 8e9fc6968605396b74b204b1d90086cfe17c572e - хеш
  2. MySuperCoolClassWithLongNameDelegate1234 - не хеш

В многочисленных онлайн-уроках вы можете найти примеры классификаторов изображений:

model = tf.keras.models.Sequential()
model.add(tf.keras.layers.Flatten())
model.add(tf.keras.layers.Dense(128, activation=tf.nn.relu))
model.add(tf.keras.layers.Dense(2, activation=tf.nn.softmax))

model.compile(optimizer='adam',
    loss='binary_crossentropy',
    metrics=['accuracy']
    )

model.fit(x_train, y_train, epochs=3)

Обычно вы загружаете изображения в виде массивов чисел (с нормализацией или без нее). И это работает отлично.

Но как лучше всего представить строки для такой проблемы?

Заранее спасибо

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...