SQL-запрос, чтобы получить количество слов в таблице - PullRequest
2 голосов
/ 05 марта 2012

У меня есть таблица с такой схемой

id name

1 jack
2 jack of eden
3 eden of uk
4 m of s

Я хочу выполнить запрос, который даст мне количество слов, подобных этому

count word
2 jack
2 eden
3 of

это означает, что Джек был здесь2 раза, eden 2 раза и 3 раза.

Надеюсь, у вас есть вопрос, я тоже пытаюсь, но не получаю правильный запрос или подход к нему

thnx

1 Ответ

3 голосов
/ 05 марта 2012

Предполагая, что ваша таблица называется temp (возможно, нет - измените ее на правильное имя вашей таблицы)

Я использовал подзапрос для поиска всех слов в вашей таблице:

select distinct regexp_substr(t.name, '[^ ]+',1,level) word , t.name, t.id
     from temp t
     connect by level <= regexp_count(t.name, ' ') + 1

этот запрос разбивает все слова из всех записей.Я присвоил ему псевдоним words.
Затем я соединил его с вашей таблицей (в запросе это называется temp) и подсчитал количество вхождений в каждой записи.

select words.word, count(regexp_count(tt.name, words.word))
from(
select distinct regexp_substr(t.name, '[^ ]+',1,level) word , t.name, t.id
 from temp t
 connect by level <= regexp_count(t.name, ' ') + 1) words, temp tt
 where words.id= tt.id
 group by words.word

Вы также можете добавить:

having count(regexp_count(tt.name, words.word)) > 1

обновление : для повышения производительности мы можем заменить внутренний подзапрос результатами конвейерной функции:
сначала создайте тип схемы и таблицу из нее:

create or replace type t is object(word varchar2(100), pk number);
/
create or replace type t_tab as table of t;
/

затем создайте функцию:

create or replace function split_string(del in varchar2) return t_tab
  pipelined is

  word    varchar2(4000);
  str_t   varchar2(4000) ;
  v_del_i number;
  iid     number;

  cursor c is
    select * from temp; -- change  to your table

begin

  for r in c loop
    str_t := r.name;
    iid   := r.id;

    while str_t is not null loop

      v_del_i := instr(str_t, del, 1, 1);

      if v_del_i = 0 then
        word  := str_t;
        str_t := '';
      else
        word  := substr(str_t, 1, v_del_i - 1);
        str_t := substr(str_t, v_del_i + 1);
      end if;

      pipe row(t(word, iid));

    end loop;

  end loop;

  return;
end split_string;

теперь запрос должен выглядеть следующим образом:

select words.word, count(regexp_count(tt.name, words.word))
from(
select word, pk as id from table(split_string(' '))) words, temp tt
 where words.id= tt.id
 group by words.word
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...