добыча текста в sqlite - PullRequest
       33

добыча текста в sqlite

1 голос
/ 24 августа 2011

У меня есть база данных sqlite, и мне нужно найти в ней наиболее часто встречающиеся слова. Пример,

текст
Стол стул напольный
Стол стул
Стол

Требуется решение

номер слова
Таблица 3
стул 2
Этаж 1

База данных большая (несколько Гб). Я ищу решение в SQL. Также возможно использование C ++ или другого подхода.

Ответы [ 2 ]

3 голосов
/ 24 августа 2011

Sqlite не имеет команды, которая позволяла бы генерировать несколько строк из одной строки (и не может быть легко; для этого требуется расширение «распаковать» SQL). Поэтому вам понадобится код приложения, чтобы разделить комментарии на слова. Чем вы можете создать таблицу, в которую вы вставляете каждое слово в отдельной строке, а затем select word, count(rowid) from words group by word, или вы можете напрямую посчитать слова, используя хэш-карту в приложении.

0 голосов
/ 24 августа 2011

http://www.sqlite.org/fts3.html

Проверьте Fts4aux - Прямой доступ к полнотекстовому указателю .

...