Есть ли способ загрузить объект Instances из WEKA без длительного времени загрузки? - PullRequest
3 голосов
/ 17 февраля 2012

Когда я загружаю файл .csv с помощью weka.core.converters.CSVLoader, weka пытается загрузить кучу вещей, которые мне не нужны (например, загрузить драйверы базы данных - см. Ниже).Мне просто нужен объект Instances как можно быстрее, чтобы я мог выполнить некоторые операции с ним.

Есть ли способ быстро загрузить объект без лишних накладных расходов?

Более новые версии Weka еще медленнее (с загруженным большим количеством материала).

Спасибо, Тодд

---Registering Weka Editors---
Trying to add database driver (JDBC): RmiJdbc.RJDriver - Warning, not in CLASSPATH?
Trying to add database driver (JDBC): jdbc.idbDriver - Warning, not in CLASSPATH?
Trying to add database driver (JDBC): org.gjt.mm.mysql.Driver - Warning, not in CLASSPATH?
Trying to add database driver (JDBC): com.mckoi.JDBCDriver - Warning, not in CLASSPATH?
Trying to add database driver (JDBC): org.hsqldb.jdbcDriver - Warning, not in CLASSPATH?

1 Ответ

1 голос
/ 11 февраля 2013

Ну, я думаю, что если вы заботитесь о производительности, вы должны запустить эксперимент с Java-программой, используя Weka API , а не из GUI или командной строки.

Но в любом случае есть несколько вещей, которые вы можете сделать, чтобы минимизировать нагрузку Weka при инициализации:

1 - Удалите то, что вам не нужно, из папки %USER_DIR%\wekafiles\packages, потому что Weka загружает эти файлы при запуске

2- В исходном коде Weka измените файл weka.experiment.DatabaseUtils.props и прокомментируйте следующую строку, которая ограничит драйверы базы данных, которые загружает Weka.

#jdbcDriver=RmiJdbc.RJDriver,jdbc.idbDriver,org.gjt.mm.mysql.Driver,com.mckoi.JDBCDriver,org.hsqldb.jdbcDriver

Как правило, вы можете искать сообщение, которое Weka отображает на консоли во время инициализации, например, "Loading properties and plugins" и найдите его в исходном коде Weka и посмотрите, что вы можете безопасно отключить.

...