Делать прогнозы из резюме - PullRequest
       34

Делать прогнозы из резюме

4 голосов
/ 19 сентября 2010

У меня есть база данных со многими резюме, включая структурированные данные о поле, возрасте, адресе, количестве лет обучения и многих других параметрах каждого человека.

Примерно для 10% выборки у меня также есть дополнительные данные об определенном действии, которое они совершили в определенный момент времени. Например, что Джейн взяла кредит на жилье в июле 1998 года или что Джон начал обучение пилотов в январе 2007 года и получил лицензию в декабре 2007 года.

Мне нужен алгоритм, который даст для каждого из действий вероятность того, что это произойдет для каждого человека в будущих приращениях времени. Например, вероятность того, что Билл получит ипотечный кредит, составляет 2% в 2011 году, 3,5% в 2012 году и т. Д.

Как мне подойти к этому? Регрессивный анализ? SVM? Нейронная сеть? Что-то еще?

Возможно, есть даже какой-нибудь стандартный инструмент / библиотека, который я могу использовать только с очевидными настройками?

Ответы [ 3 ]

1 голос
/ 12 октября 2010

Лу прав, так обстоит дело с «байесовским умозаключением».

Лучшим инструментом / библиотекой для решения этой проблемы является язык программирования статистики R (r-project.org).

Взгляните на библиотеки байесовского вывода в R: http://cran.r -project.org / веб / просмотров / Bayesian.html

Сколько человек входит в «10% выборки»? Если это ниже 100 человек или около того, я бы опасался, что результаты анализа не могут быть значительными. Если это 1000 или более человек, результаты будут довольно хорошими (эмпирическое правило).

Я бы сначала экспортировал данные в R (r-проект) и сделал бы некоторую необходимую очистку данных. Тогда найдите человека, знакомого с R и продвинутой статистикой, он сможет решить это очень быстро. Или попробуйте сами, но в начале R занимает некоторое время.

1 голос
/ 09 декабря 2011

Что касается выбора инструмента / библиотеки, я предлагаю вам попробовать Weka . Это инструмент с открытым исходным кодом для экспериментов с интеллектуальным анализом данных и машинным обучением . Weka имеет несколько инструментов для чтения, обработки и фильтрации ваших данных, а также инструменты прогнозирования и классификации.

Однако вы должны иметь прочную основу в вышеупомянутых областях, чтобы стремиться к полезному результату.

1 голос
/ 19 сентября 2010

Вероятность того, что X случится с учетом того, что Y произошел, прямо из байесовского вывода, я думаю.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...