Я запускаю алгоритм наивного байесовского классификатора через apache mahout. У нас есть...
У меня есть список, в котором содержатся предложения, выделенные из тестового абзаца.Я пытаюсь...
Я пытаюсь реализовать нечеткий поиск на клиентской стороне JavaScript, чтобы искать большие базы...
Я пытаюсь сгенерировать униграмму из текстового файла. Но отображается только биграмма для первой...
Я пытаюсь закодировать диссоциированный алгоритм печати на основе n-граммы в scala.Как создать...
Я использую SOLR в качестве поисковой системы для интрасети с чуть более 40000 документов.Я...
Я извлекаю 4 грамма из двоичных элементов в шестнадцатеричной форме, это означает, что я могу иметь...
Есть ли простой способ сохранить результат Google Ngram http://books.google.com/ngrams/ как csv?...
Я пытаюсь написать алгоритм (который, как я предполагаю, будет опираться на методы обработки...
Я использую NLTK для поиска n-граммов в корпусе, но в некоторых случаях это занимает очень много...
Я строю базу данных MySQL, в которой будет примерно 10 000 записей. Каждая запись будет содержать...
Я хочу просканировать огромный корпус текста и посчитать частоты слов (частоты n-грамм на самом...
Я работал над проектом по извлечению большого количества коротких текстов и распределению их по...
Каков наилучший способ извлечь ключевые фразы из блока текста? Я пишу инструмент для извлечения...
Я хотел бы найти какой-то тип пакета или модуля (предпочтительно Python или Perl, но другие это...
Я пытаюсь выполнить какой-то паттерн 'майнинг' в части из нескольких слов в каждой строке. Я провел...
В настоящее время я использую то, что (по ошибке) я думаю, было бы довольно простой реализацией...
В последнее время меня интересует классификация текста и языковая классификация, основанная на...
Я пытаюсь создать приложение, которое использует триграммы для приблизительного соответствия строк....
Мне нужно смоделировать коллекцию n-граммов (последовательности из n слов) и их контексты (слова,...
Мне было интересно, есть ли место для загрузки многоязычных списков слов из Викисловаря?
Я хочу создать файл языковой модели ARPA, содержащий почти 50 000 слов. Я не могу сгенерировать...
У меня большой корпус из n-грамм и несколько внешних n-грамм. Я хочу рассчитать оценку PMI каждого...
У меня есть ARPA LM, сгенерированный kylm , при запуске SPHINX я получаю эту трассировку стека...
У меня есть файл ARPA, который составляет почти 1 ГБ. Я должен сделать поиск в нем менее чем за 1...