как конвертировать CSV в таблицу в Oracle - PullRequest
9 голосов
/ 29 июня 2010

Как создать пакет, который возвращает результаты в формате таблицы при передаче в значениях CSV.

select * from table(schema.mypackage.myfunction('one, two, three'))

должен возвращать

one
two
three

Я пытался что-то из спросить Тома но это работает только с типами sql.

Я использую оракула 11g.Есть что-то встроенное?

Ответы [ 5 ]

12 голосов
/ 29 июня 2010

следующие работы ссылаться на это как выбрать * из таблицы (разделитель ('a, b, c, d'))

create or replace function splitter(p_str in varchar2) return  sys.odcivarchar2list
is
v_tab sys.odcivarchar2list:=new sys.odcivarchar2list();
begin
with cte as (select level  ind from dual
connect by 
level <=regexp_count(p_str,',') +1
)
select regexp_substr(p_str,'[^,]+',1,ind)
bulk collect into v_tab
from cte;
return v_tab;
end;
/
5 голосов
/ 29 июня 2010

Увы, в 11g нам все еще приходится обрабатывать свои собственные токены для PL / SQL, используя типы SQL.В 11gR2 Oracle дал нам функцию агрегирования для объединения результатов в строку CSV, поэтому, возможно, в 12i они предоставят обратную возможность.

Если вы не хотите создавать тип SQL, особенно вы можете использовать встроенный-in SYS.DBMS_DEBUG_VC2COLL, например:

create or replace function string_tokenizer
    (p_string in varchar2
        , p_separator in varchar2 := ',')
    return sys.dbms_debug_vc2coll
is
    return_value SYS.DBMS_DEBUG_VC2COLL;
    pattern varchar2(250);
begin

    pattern := '[^('''||p_separator||''')]+' ;

    select trim(regexp_substr (p_string, pattern, 1, level)) token
    bulk collect into return_value
    from dual
    where regexp_substr (p_string, pattern, 1, level) is not null
    connect by regexp_instr (p_string, pattern, 1, level) > 0;

    return return_value;

end string_tokenizer;
/

Вот оно в действии:

SQL> select * from table (string_tokenizer('one, two, three'))
  2  /

COLUMN_VALUE
----------------------------------------------------------------
one
two
three

SQL>

Подтверждение: этот код является вариантом кода, который я нашел на TanelБлог Подера .

4 голосов
/ 05 декабря 2012

Вот еще одно решение, использующее средство сравнения регулярных выражений полностью в sql.

SELECT regexp_substr('one,two,three','[^,]+', 1, level) abc
FROM dual 
CONNECT BY regexp_substr('one,two,three', '[^,]+', 1, level) IS NOT NULL
3 голосов
/ 07 июля 2014

Для оптимальной производительности лучше всего избегать использования иерархических (CONNECT BY) запросов в функции сплиттера.

Следующая функция сплиттера работает намного лучше при применении к большим объемам данных

CREATE OR REPLACE FUNCTION row2col(p_clob_text IN VARCHAR2) 
   RETURN sys.dbms_debug_vc2coll PIPELINED 
IS
     next_new_line_indx PLS_INTEGER;
     remaining_text VARCHAR2(20000);
     next_piece_for_piping VARCHAR2(20000);
  BEGIN

    remaining_text := p_clob_text;
    LOOP
       next_new_line_indx := instr(remaining_text, ','); 
       next_piece_for_piping :=
          CASE
             WHEN next_new_line_indx <> 0 THEN
                TRIM(SUBSTR(remaining_text, 1, next_new_line_indx-1))
             ELSE
                TRIM(SUBSTR(remaining_text, 1))
          END;

       remaining_text := SUBSTR(remaining_text, next_new_line_indx+1 );
       PIPE ROW(next_piece_for_piping);
       EXIT WHEN next_new_line_indx = 0 OR remaining_text IS NULL;
    END LOOP;
    RETURN;
  END row2col;
/

Эту разницу в производительности можно наблюдать ниже (я использовал разделитель функций, как было указано ранее в этом обсуждении).

SQL> SET TIMING ON
SQL>
SQL> WITH SRC AS (
  2  SELECT rownum||',a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p,q,r,s,t,u,v,w,x,y,z'||rownum txt
  3  FROM DUAL
  4  CONNECT BY LEVEL <=10000
  5  )
  6  SELECT  NULL
  7  FROM SRC, TABLE(SYSTEM.row2col(txt)) t
  8  HAVING MAX(t.column_value) > 'zzz'
  9  ;

no rows selected

Elapsed: 00:00:00.93
SQL>
SQL> WITH SRC AS (
  2  SELECT rownum||',a,b,c,d,e,f,g,h,i,j,k,l,m,n,o,p,q,r,s,t,u,v,w,x,y,z'||rownum txt
  3  FROM DUAL
  4  CONNECT BY LEVEL <=10000
  5  )
  6  SELECT  NULL
  7  FROM SRC, TABLE(splitter(txt)) t
  8  HAVING MAX(t.column_value) > 'zzz'
  9  ;

no rows selected

Elapsed: 00:00:14.90
SQL>
SQL> SET TIMING OFF
SQL>
0 голосов
/ 29 июня 2010

У меня не установлено 11g для игры, но есть операция PIVOT и UNPIVOT для преобразования столбцов в строки / строки в столбцы, что может быть хорошей отправной точкой.

http://www.oracle.com/technology/pub/articles/oracle-database-11g-top-features/11g-pivot.html

(На самом деле, проведя дальнейшее исследование, это не выглядит подходящим для этого случая - он работает с реальными строками / столбцами, но не с наборами данных в столбце).

Существует такжеDBMS_UTILITY.comma_to_table и table_to_comma для преобразования списков CSV в таблицы pl / sql.Существуют некоторые ограничения (обработка перевода строки и т. Д.), Но они могут быть хорошей отправной точкой.

Я бы хотел использовать подход TYPE с простой функцией, которая выполняет comma_to_table, а затем PIPE ROW для каждой записи врезультат comma_to_table (к сожалению, DBMS_UTILITY.comma_to_table является процедурой, поэтому не может вызываться из SQL).

...