У меня есть база данных со многими резюме, включая структурированные данные о поле, возрасте, адресе, количестве лет обучения и многих других параметрах каждого человека.
Примерно для 10% выборки у меня также есть дополнительные данные об определенном действии, которое они совершили в определенный момент времени. Например, что Джейн взяла кредит на жилье в июле 1998 года или что Джон начал обучение пилотов в январе 2007 года и получил лицензию в декабре 2007 года.
Мне нужен алгоритм, который даст для каждого из действий вероятность того, что это произойдет для каждого человека в будущих приращениях времени. Например, вероятность того, что Билл получит ипотечный кредит, составляет 2% в 2011 году, 3,5% в 2012 году и т. Д.
Как мне подойти к этому? Регрессивный анализ? SVM? Нейронная сеть? Что-то еще?
Возможно, есть даже какой-нибудь стандартный инструмент / библиотека, который я могу использовать только с очевидными настройками?