Question

Я пытался заставить модель языка на уровне слов работать на lingpipe.Все примеры и учебники, с которыми я столкнулся, показывают модель персонажа и граммы.Как мне использовать lingpipe для обучения модели на уровне слов, а затем использовать эту модель для тестирования ее на других документах?

Кроме того, я заметил, что TokenizedLM не сериализуем.Разве я не могу сохранить его и загрузить позже, не проходя переподготовку каждый раз?

Наконец, есть ли какие-либо другие фреймворки / инструменты, которые позволили бы мне делать это без какого-либо программирования на моемчасть

tobigue · Answer 1 · 08 ноября 2011

Я не знаю о Java, но если вы не привязаны к этому языку программирования, есть Python NLTK , который имеет токенизаторы и ngram-models и множество других вещей . Существует также книга , которую можно использовать для ознакомления и получения общего обзора.

Использование Lingpipe для языковой модели на уровне слов

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Использование Lingpipe для языковой модели на уровне слов

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы