Question

В настоящее время я использую инструменты Stanford CoreNLP для извлечения триплетов из текста. Я имел дело с относительно небольшими частями текста, но мне нужно, чтобы он работал с большими. Также мне нужна эта работа на средней машине со средним объемом памяти. Любые предложения о том, как я могу уменьшить нагрузку на память? Возможно, разделить текст на более мелкие фрагменты (однако это может испортить основную информацию ...)?

Спасибо

Skarab · Answer 1 · 02 июля 2011

Метод перебора: используйте память вне кучи (используя дисковое пространство в качестве памяти для Java-программы), посмотрите этот поток или , чтобы узнать больше о библиотеке BigMemory Медленно, но это может быть то, что вы ищете.

Стэнфордские инструменты НЛП и много текста

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Стэнфордские инструменты НЛП и много текста

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы