Я задаю этот вопрос как ленивый исследователь, который просто хочет быстро опробовать случайные сумасшедшие идеи, не тратя кучу времени на изобретения колес. Я полностью понимаю, что это не те случаи использования.
Чтобы проверить ряд гипотез, я бы с удовольствием
- генерирует кортежи (target, context, +1) по-другому, вместо скользящего окна по умолчанию.
- генерирует кортежи отрицательных выборок (target, random_context, -1) на основе некоторых правил вместо случайных ничьих NCE.
Например, я могу получить дерево разбора предложения и использовать отношения родитель-потомок для генерации кортежей, которые являются нелинейным окном (кто-то уже пробовал это в исследовательском сообществе НЛП, закодировано вручную ...) , Я также могу получить словарь антонимов для поиска и генерирования большего количества отрицательных выборок в дополнение к случайным (не уверен, может помочь с более быстрой конвергенцией).
Существуют ли некоторые частные функции-члены (которые начинаются с _XX
), которые я могу переопределить для достижения этих целей?