обучение по классификации с использованием libsvm - PullRequest
3 голосов
/ 10 марта 2010

Я хочу классифицировать, используя libsvm. У меня есть 9 обучающих наборов, каждый набор имеет 144000 маркированных экземпляров, каждый из которых имеет переменное количество функций. Обучение одного сета занимает около 12 часов (./svm-train с оценками вероятности). Поскольку у меня не так много времени, я бы хотел запустить более одного сета за раз. Я не уверен, смогу ли я сделать это .. Могу ли я запустить все 9 процессов одновременно на разных терминалах?

./svm-train -b 1 feat1.txt
./svm-train -b 1 feat2.txt
      .
      .
      .
./svm-train -b 1 feat9.txt

(я использую Fedora Core 5)

Ответы [ 3 ]

7 голосов
/ 21 июля 2010

Вы можете указать libsvm использовать openmp для распараллеливания. Посмотрите на эту статью в libsvm: http://www.csie.ntu.edu.tw/~cjlin/libsvm/faq.html#f432

3 голосов
/ 11 марта 2010

Как сказал Адам, все зависит от того, сколько ядер и процессоров имеется в вашей системе. Если этого недостаточно, почему бы не запустить несколько экземпляров EC2 для запуска?

Публичный AMI Infochimps MachetEC2 поставляется с большинством необходимых вам инструментов: http://blog.infochimps.org/2009/02/06/start-hacking-machetec2-released/

2 голосов
/ 10 марта 2010

Да. Но если у вас нет многоядерной или многопроцессорной системы, это может не сэкономить вам столько времени.

...