При условии следующей настройки:
create table data (id serial, kv jsonb, col1 text);
insert into data (kv, col1)
values
('[{"k1": "v1"}, {"k2": "v22"}]', 'web'),
('[{"k10": "v5"}, {"k9": "v21"}]', 'mobile'),
('[{"k1": "v1"}, {"k5": "v24"}]', 'web1'),
('[{"k5": "v1"}, {"k55": "v24"}]', 'web1');
Вы можете получить эти строки, сначала нормализуя данные, затем выполнив самостоятельное объединение нормализованных данных. Чтобы нормализовать данные, необходимо дважды развернуть значения JSON: один раз для выравнивания массивов, а затем еще раз для извлечения ключей из значений JSON:
with normalized as (
select d.id, t2.*
from data d
join jsonb_array_elements(kv) as t1(kv) on true
join jsonb_each_text(t1.kv) as t2(k,val) on true
)
select n1.*
from normalized n1
where exists (select *
from normalized n2
where n1.id <> n2.id
and n1.k = n2.k);
Вышеуказанное возвращает:
id | k | val
---+----+----
1 | k1 | v1
3 | k1 | v1
3 | k5 | v24
4 | k5 | v1
Или используйте его с условием IN, чтобы получить исходные строки:
with normalized as (
select d.id, t2.*
from data d
join jsonb_array_elements(kv) as t1(kv) on true
join jsonb_each_text(t1.kv) as t2(k,val) on true
)
select *
from data
where id in (select n1.id
from normalized n1
where exists (select *
from normalized n2
where n1.id <> n2.id
and n1.k = n2.k))
возвращается:
id | kv | col1
---+--------------------------------+-----
1 | [{"k1": "v1"}, {"k2": "v22"}] | web
3 | [{"k1": "v1"}, {"k5": "v24"}] | web1
4 | [{"k5": "v1"}, {"k55": "v24"}] | web1
Этот тип запроса будет проще, если вы не сохраните пары ключ / значение в массиве, '{"k1": "v1", "k2": "v22"}'
будет иметь для меня гораздо больший смысл, чем [{"k1": "v1"}, {"k2": "v22"}]