Нет. Проблема в том, что в каждом предложении индекс позиции имеет совершенно другое значение, поэтому сети было бы крайне важно узнать, что делать. Вы можете представить матрицу параметров в окончательной проекции в виде вложений целевых классов, а классификацию - в качестве измерения сходства состояния вывода из вложений классов.
Я предлагаю выполнять классификацию аналогично тому, что люди иногда делают в зависимости синтаксические анализаторы, т. е. для каждой пары слов, классифицируют, существует ли связь между словами или нет .
BERT дает матрицу с контекстными вложениями для каждого предложения. Создайте из него трехмерный тензор, где позиция [i, j]
содержит конкатенацию представления слов i
и j
. Затем классифицируйте каждую из этих пар как true / false, сообщая, является ли связь зависимостей между этими двумя словами или нет.