Тройная потеря при встраивании текста с помощью кера - PullRequest
0 голосов
/ 09 июля 2019

Я бы начал говорить, что я новичок в Keras и в машинном обучении в целом.Я пытаюсь построить «экспериментальную» модель, состоящую из двух частей:

  1. «Кодер», который принимает строку (содержащую длинный ряд атрибутов, я использую DBLP-ACM набор данных), создает встраивание слов этой строки (word2vec) и кодирует их в векторе (двунаправленный LSTM).
  2. Обучаемая модель, которая принимает 3 вектора на входе (результат модели 1) и использует триплетную потерю как функцию потерь (я уже определил ее, используя евклидово расстояние между векторами)

Моим первым шагом была адаптация этой модели к моему набору данных, затем я создал набор данных триплетов и определил функцию потерь триплетов, как я уже говорил ранее.Сейчас я пытаюсь выяснить, как я могу изменить эту модель, чтобы она принимала 3 входа, различая шаг 1 и шаг 2 и применяя правильную функцию потерь.

Это довольно сложно, но я уверен, что это проще, чем я думаю.Я могу предоставить свою фактическую модель, но она очень похожа на ту, которую я связал выше (которая должна представлять первый шаг), за исключением формата ввода.Каждый совет, идея или фрагмент кода приветствуются!

...