Вы хотите создать модель рекомендации.
Я собираюсь предположить, что у вас есть целевые данные (кандидаты и объявления о вакансиях, которые, как вы знаете, связаны), потому что если вы этого не сделаете, я не могу понять, какВы можете сделать это (по крайней мере, не с машинным обучением, все, что вы можете сделать, это использовать свои знания, чтобы написать правило (ваш мозг имеет данные из вашего жизненного опыта, но алгоритм этого не делает)).
Это, вероятно,будет матрица факторизации.Я рекомендую вам попробовать модель WNMF (взвешенная неотрицательная матричная факторизация).
Для этого есть 3 шага:
Попробуйте встроить слои в характеристики ваших кандидатов (по одному для каждой характеристики),Сложите эти векторы вместе, это будет представление кандидата в скрытом пространстве.
Найдите способ преобразовать ваши вакансии в векторы одинаковой длины.Вы можете проверить doc2vec, чтобы сделать это.Это далеко не самый сложный шаг, потому что преобразовать текст в вектор при сохранении информации может быть очень сложно.Вот почему также может быть хорошей идеей создать функцию, которая отображает каждый документ на вектор самостоятельно, даже если это не машинное обучение (в документе есть слово «компьютер»? Требуется ли большой опыт? Знаете, какие функции важны?и создайте вектор с этими функциями).
Вычислите скалярное произведение векторов кандидатов и вакансий, чтобы получить свой прогноз.Сравните это с вашей целью (1, если кандидат был связан с работой, 0, если нет).Если попытаться использовать регрессию, ваш прогноз будет сопоставим с вероятностью кандидата и совмещаемой работой.