Определение частей в последовательности текста с использованием глубокого обучения - PullRequest
0 голосов
/ 11 ноября 2019

Прежде всего, я очень плохо знаком с глубоким изучением и извиняюсь, если не задаю вопросы, которые не соответствуют стандарту сайта.

У меня есть последовательность arm assembly opcodes, которые соответствуют ряду функций (Вы можете просмотреть весь файл csv из здесь ). Если я приведу одну конкретную последовательность функции, это будет следующим.

// This is the disassembly sequence of a function named bit()

// just assume four opcodes `b0 0a 46 01` belong to certain other library
83 b0 0a 46 01 90 02 a8 01 70 ff e7 01 98 01 68 01 22 52 05 91 43 01 60 02 a8 00 78 40 05 00 90 ff e7 01 98 01 68 00 9a 11 43 01 60 01 98 03 b0 70 47 

Я уже построил небольшую модель глубокого обучения (следуя учебному пособию по НЛП) для классификации между восемью классами функций при передаче байтовой последовательности, как указано выше. Однако, в дополнение к идентификации метки функции, мне нужно идентифицировать последовательность байтов, принадлежащих конкретной библиотеке. Например, в приведенной выше функции b0 0a 46 01 верьте другой библиотеке. Поэтому я хочу идентифицировать такие подпоследовательности, когда передается целая последовательность функций. Я считаю, что это похоже на обнаружение объектов на изображениях, где вместо простой идентификации самого изображения идентифицируют объекты в модели.

Честно говоря, я не знаю, возможно ли такое требование в глубоком обучении, и, если возможно, я хотел бы знать любые ресурсы / учебные пособия, которые я мог бы найти и изучить, чтобы достичь своей цели. Еще раз, извините, если я спрашиваю что-то, что не имеет смысла. Ценю любую помощь, если это возможно.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...