Мы пытаемся определить местонахождение определенной информации, хранящейся на нашем предприятии, чтобы привести ее в соответствие с нашими политиками данных. В конце файла мы используем Nessus для поиска по разным файлам, но мне интересно узнать о конце базы данных.
Использование Nessus казалось бы в значительной степени бессмысленным, поскольку оно выводило бы необработанные данные и не сообщало бы нам, в какой таблице или строке оно находилось, или давало бы нам много полезной информации, особенно учитывая, что эти базы данных достаточно велики (сотни гигабайт).
Также стоит отметить, что эта система должна иметь возможность выполнять сопоставление на основе шаблонов (например, с помощью регулярных выражений). Не просто «тупой поисковый» движок.
Я исследовал использование Data Mining и Warehousing для того, чтобы найти эти данные, но похоже, что они больше предназначены для анализа данных, чем просто для поиска данных.
Есть ли лучший способ поиска больших объемов данных в базе данных, чтобы попытаться найти эту информацию? Мы используем и Oracle 11g, и SQL Server 2008, и нам нужно выполнить поиск по обоим, поэтому я бы хотел избежать серверно-ориентированных парадигм (хотя, если мне придется переписать некоторый код для перевода из T-SQL в PL / SQL, и наоборот, я не против)