Поле Oracle VARCHAR2 на сегодняшний день с подстрокой - PullRequest
0 голосов
/ 10 мая 2019

У меня очень грязное поле даты, которое подается из нескольких систем, каждая со своим собственным форматом даты.

У меня есть:

ДД-ММ-ГГ чч: мм: сс.сссс

DD-MON-YY чч: мм: сс

ДД-ММ-ГГГГ чч: мм: сс.сссс

Все это хранится в поле varchar2 . Теперь я должен сделать поиск между диапазонами дат, и это вызывает у меня проблемы. Как я могу подойти к этому?

Вот некоторые фрагменты кода, которые я пробовал:

Стандартный подстрок работает хорошо, но я не могу учитывать разные форматы даты:

select substr(created_on, 1,9) as date2 from rtl.HK_Alerts

В идеале, если я смогу заставить это работать:

select to_date(created_on, 'dd-mon-yy') as date_convert from rtl.HK_Alerts

Тогда я могу сделать это:

select * from my_table 
    where to_date(created_on, 'dd-mon-yy') > '01-Jan-1970'
    and to_date(***strong text***created_on, 'dd-mon-yy') < '31-Jan-1970'

Кроме того, как я могу учесть разные форматы даты из разных систем? К сожалению, нет системного идентификатора, с которым я мог бы работать.

вот изображение некоторых дат: created_on_date

07-ЯНВ-19 01.53.47.702000000
07-ЯНВ-19 01.53.47.992000000
07 января 19.01.53.48.186000000
07-ЯНВ-19 01.53.48.360000000
07-ЯНВ-19 01.53.48.548000000
07-ЯНВ-19 01.53.48.709000000
07 января 19.01.53.48.900000000
20 ЯНВ-19 22.49.30.801000000
20 ЯНВ-19 22.49.30.014000000
20-ЯНВ-19 22.49.33.968000000

Ответы [ 2 ]

3 голосов
/ 10 мая 2019

Возможно, вы обдумываете это.По умолчанию преобразование даты в Oracle довольно гибкое, и это хорошо и плохо.В этом случае, если у вас есть только форматы, которые вы показали, то преобразование может быть выполнено с использованием одной маски формата:

to_timestamp(created_on, 'DD-MM-RRRR HH24:MI:SS.FF')

Демонстрация с некоторыми подготовленными данными:

-- CTE for sample data
with hk_alerts (created_on) as (
            select '10-05-19 12:34:56' from dual
  union all select '10-05-19 12:34:56.789' from dual
  union all select '10-May-19 12:34:56' from dual
  union all select '10-May-19 12:34:56.789' from dual
  union all select '10-May-2019 12:34:56' from dual
  union all select '10-May-2019 12:34:56.789' from dual
)
-- actual query
select created_on, to_timestamp(created_on, 'DD-MM-RRRR HH24:MI:SS.FF') as date_convert
from hk_alerts;

CREATED_ON               DATE_CONVERT                 
------------------------ -----------------------------
10-05-19 12:34:56        2019-05-10 12:34:56.000000000
10-05-19 12:34:56.789    2019-05-10 12:34:56.789000000
10-May-19 12:34:56       2019-05-10 12:34:56.000000000
10-May-19 12:34:56.789   2019-05-10 12:34:56.789000000
10-May-2019 12:34:56     2019-05-10 12:34:56.000000000
10-May-2019 12:34:56.789 2019-05-10 12:34:56.789000000

Конечно, это все еще должно предполагать, что любые строки, использующие названия / сокращения месяцев, находятся на том же языке, который использует ваш сеанс.Хотя с этим мало что можно поделать.

Ваше сравнение можно затем выполнить с литералами меток времени:

where to_timestamp(created_on, 'DD-MM-RRRR HH24:MI:SS.FF') >= timestamp '1970-01-01 00:00:00'
and to_timestamp(created_on, 'DD-MM-RRRR HH24:MI:SS.FF') < timestamp '1970-02-01 00:00:00'
3 голосов
/ 10 мая 2019

Вы можете написать некоторую логику переключения, которая преобразует каждую строку метки времени в истинную метку времени, используя соответствующую маску.Вот пример:

SELECT
    created_on,
    CASE WHEN REGEXP_LIKE (created_on, '^[0-9]{2}-[0-9]{2}-[0-9]{4}')
         THEN TO_TIMESTAMP(created_on, 'DD-MM-YYYY HH24:MI:SS.FF') END AS 
         WHEN REGEXP_LIKE (created_on, '^[0-9]{2}-[0-9]{2}-[0-9]{2}')
         THEN TO_TIMESTAMP(created_on, 'DD-MM-RR HH24:MI:SS.FF')
         WHEN REGEXP_LIKE (created_on, '^[0-9]{2}-[A-Z]{3}-[0-9]{2}')
         THEN TO_TIMESTAMP(created_on, 'DD-MON-RR HH24:MI:SS')

create_on_ts FROM rtl.HK_Alerts;

enter image description here

Демо

Но лучшим долгосрочным решением здесь может быть исправление исходных данных таким образом, чтобы все входящие метки времени были стандартизированы и в формате, который Oracle может легко использовать.

...