postgresql уникальный непоследовательный идентификатор для URL - PullRequest
1 голос
/ 10 мая 2019

Я посмотрел несколько способов создания буквенно-цифровых идентификаторов в Stackoverflow, но у всех них были свои недостатки, некоторые не проверяли наличие конфликтов, а другие использовали последовательности, которые не подходят для использования при логической репликации.

После некоторого поиска в Google я нашел этот веб-сайт, на котором есть следующий скрипт, который проверяет наличие коллизий и не использует последовательности.Однако это делается как триггер, когда в таблицу вставляется строка.

-- Create a trigger function that takes no arguments.
-- Trigger functions automatically have OLD, NEW records
-- and TG_TABLE_NAME as well as others.
CREATE OR REPLACE FUNCTION unique_short_id()
RETURNS TRIGGER AS $$

 -- Declare the variables we'll be using.
DECLARE
  key TEXT;
  qry TEXT;
  found TEXT;
BEGIN

  -- generate the first part of a query as a string with safely
  -- escaped table name, using || to concat the parts
  qry := 'SELECT id FROM ' || quote_ident(TG_TABLE_NAME) || ' WHERE id=';

  -- This loop will probably only run once per call until we've generated
  -- millions of ids.
  LOOP

    -- Generate our string bytes and re-encode as a base64 string.
    key := encode(gen_random_bytes(6), 'base64');

    -- Base64 encoding contains 2 URL unsafe characters by default.
    -- The URL-safe version has these replacements.
    key := replace(key, '/', '_'); -- url safe replacement
    key := replace(key, '+', '-'); -- url safe replacement

    -- Concat the generated key (safely quoted) with the generated query
    -- and run it.
    -- SELECT id FROM "test" WHERE id='blahblah' INTO found
    -- Now "found" will be the duplicated id or NULL.
    EXECUTE qry || quote_literal(key) INTO found;

    -- Check to see if found is NULL.
    -- If we checked to see if found = NULL it would always be FALSE
    -- because (NULL = NULL) is always FALSE.
    IF found IS NULL THEN

      -- If we didn't find a collision then leave the LOOP.
      EXIT;
    END IF;

    -- We haven't EXITed yet, so return to the top of the LOOP
    -- and try again.
  END LOOP;

  -- NEW and OLD are available in TRIGGER PROCEDURES.
  -- NEW is the mutated row that will actually be INSERTed.
  -- We're replacing id, regardless of what it was before
  -- with our key variable.
  NEW.id = key;

  -- The RECORD returned here is what will actually be INSERTed,
  -- or what the next trigger will get if there is one.
  RETURN NEW;
END;
$$ language 'plpgsql';

У меня есть таблица, которая уже содержит данные, я добавил новый столбец с именем pid, возможно лиизмените это и используйте вызов функции по умолчанию, чтобы все мои предыдущие данные получили короткий идентификатор?

1 Ответ

2 голосов
/ 10 мая 2019

Предположим, у вас есть таблица test:

DROP TABLE IF EXISTS test;
CREATE TABLE test (foo text, bar int);
INSERT INTO test (foo, bar) VALUES ('A', 1), ('B', 2);

Вы можете добавить к нему столбец id:

ALTER TABLE test ADD COLUMN id text;

и прикрепите триггер:

DROP TRIGGER IF EXISTS unique_short_id_on_test ON test;
CREATE TRIGGER unique_short_id_on_test
    BEFORE INSERT ON test
    FOR EACH ROW EXECUTE PROCEDURE unique_short_id();

Теперь создайте временную таблицу, temp, с такой же структурой, как у теста (но без данных):

DROP TABLE IF EXISTS temp;
CREATE TABLE temp (LIKE test INCLUDING ALL);
CREATE TRIGGER unique_short_id_on_temp
    BEFORE INSERT ON temp
    FOR EACH ROW EXECUTE PROCEDURE unique_short_id();

Заливка test в temp:

INSERT INTO temp (foo, bar)
SELECT foo, bar
FROM test
RETURNING *

дает что-то вроде:

| foo        | bar | id       |
|------------+-----+----------|
| A          |   1 | 9yt9XQwm |
| B          |   2 | LCeiA-P8 |

Если в других таблицах есть ссылки на внешний ключ в таблице test или если test должен оставаться в сети, может быть невозможно сбросить test и переименовать temp в test. Вместо этого безопаснее обновить test с id s из temp.

Предположим, test имеет первичный ключ (для конкретности, назовем его testid), затем Вы можете обновить test с помощью id s из temp, используя:

UPDATE test
SET id = temp.id
FROM temp
WHERE test.testid = temp.testid;

Тогда вы можете сбросить таблицу temp:

DROP TABLE temp;
...