Как найти последний раз, когда база данных PostgreSQL обновлялась? - PullRequest
18 голосов
/ 22 мая 2009

Я работаю с базой данных postgreSQL, которая обновляется партиями. Мне нужно знать, когда последний раз, когда база данных (или таблица в базе данных) обновлялась или изменялась, либо будет делать.

Я видел, что кто-то на форуме postgeSQL предложил использовать ведение журнала и запрашивать ваши журналы в течение определенного времени. Это не будет работать для меня, так как я не могу контролировать клиентскую кодовую базу.

Ответы [ 5 ]

24 голосов
/ 22 мая 2009

Вы можете написать триггер для запуска каждый раз, когда выполняется вставка / обновление в определенной таблице. Обычно используется для установки столбца «create» или «last_updated» строки на текущее время, но вы также можете обновить время в центральном местоположении, если вы не хотите изменять существующие таблицы.

Так, например, типичный способ следующий:

CREATE FUNCTION stamp_updated() RETURNS TRIGGER LANGUAGE 'plpgsql' AS $$
BEGIN
  NEW.last_updated := now();
  RETURN NEW;
END
$$;
-- repeat for each table you need to track:
ALTER TABLE sometable ADD COLUMN last_updated TIMESTAMP;
CREATE TRIGGER sometable_stamp_updated
  BEFORE INSERT OR UPDATE ON sometable
  FOR EACH ROW EXECUTE PROCEDURE stamp_updated();

Затем, чтобы найти время последнего обновления, вам нужно выбрать «MAX (last_updated)» из каждой таблицы, которую вы отслеживаете, и взять самую большую из них, например ::10000

SELECT MAX(max_last_updated) FROM (
  SELECT MAX(last_updated) AS max_last_updated FROM sometable
  UNION ALL
  SELECT MAX(last_updated) FROM someothertable
) updates

Для таблиц с последовательным (или сгенерированным аналогичным образом) первичным ключом вы можете попытаться избежать последовательного сканирования, чтобы найти последнее время обновления, используя индекс первичного ключа, или создать индексы для last_updated.

-- get timestamp of row with highest id
SELECT last_updated FROM sometable ORDER BY sometable_id DESC LIMIT 1

Обратите внимание, что это может дать немного неправильные результаты в случае, если идентификаторы не являются достаточно последовательными, но какая точность вам нужна? (Помните, что транзакции означают, что строки могут становиться видимыми для вас в порядке, отличном от создаваемого ими.)

Альтернативный подход, позволяющий избежать добавления «обновленных» столбцов в каждую таблицу, состоит в том, чтобы иметь центральную таблицу для хранения временных меток обновления. Например:

CREATE TABLE update_log(table_name text PRIMARY KEY, updated timestamp NOT NULL DEFAULT now());
CREATE FUNCTION stamp_update_log() RETURNS TRIGGER LANGUAGE 'plpgsql' AS $$
BEGIN
  INSERT INTO update_log(table_name) VALUES(TG_TABLE_NAME);
  RETURN NEW;
END
$$;
-- Repeat for each table you need to track:
CREATE TRIGGER sometable_stamp_update_log
 AFTER INSERT OR UPDATE ON sometable
 FOR EACH STATEMENT EXECUTE stamp_update_log();

Это даст вам таблицу со строкой для каждого обновления таблицы: тогда вы можете просто сделать:

SELECT MAX(updated) FROM update_log

Чтобы получить время последнего обновления. (Вы можете разделить это по таблице, если хотите). Эта таблица, конечно, будет продолжать расти: либо создайте индекс для «обновленного» (что должно сделать получение последнего достаточно быстрым), либо периодически усекайте его, если это соответствует вашему варианту использования (например, установите эксклюзивную блокировку таблицы, получите последнее время обновления, а затем обрежьте его, если вам нужно периодически проверять, были ли внесены изменения).

Альтернативный подход - который может означать то, что имели в виду люди на форуме - это установить 'log_statement = mod' в конфигурации базы данных (либо для кластера глобально, либо для базы данных или пользователя, которого нужно отслеживать), а затем все операторы, которые изменяют базу данных, будут записаны в журнал сервера. Затем вам нужно будет написать что-то вне базы данных, чтобы просканировать журнал сервера, отфильтровать таблицы, которые вам не интересны, и т. Д.

4 голосов
/ 30 апреля 2015

Мне нравится подход Джека. Вы можете запросить статистику таблицы и узнать количество вставок, обновлений, удалений и так:

select n_tup_upd from pg_stat_user_tables  where relname = 'YOUR_TABLE';

каждое обновление увеличивает счет на 1.

Принимая во внимание, этот метод жизнеспособен, если у вас есть одна БД. несколько экземпляров потребуют другого подхода, вероятно.

4 голосов
/ 28 августа 2011

Похоже, вы можете использовать pg_stat_database, чтобы получить счетчик транзакций и проверить, изменяется ли это от одного резервного копирования к следующему - см. этот ответ dba.se и комментарии для более подробной информации

2 голосов
/ 22 мая 2009

См. Следующую статью:

MySQL против PostgreSQL: добавление столбца «Время последнего изменения» в таблицу http://www.pointbeing.net/weblog/2008/03/mysql-versus-postgresql-adding-a-last-modified-column-to-a-table.html

0 голосов
/ 09 января 2013

Вы можете написать хранимую процедуру на «ненадежном языке» (например, plpythonu): это позволяет получить доступ к файлам в «базовом» каталоге postgres. Верните значения mtime этих файлов в хранимую процедуру.

Но это только расплывчато, так как вакуум изменит эти файлы и mtime.

...