Общая цель - у меня есть озеро данных с кучей таблиц.Мне нужно автоматически определить, какие таблицы содержат столбцы, связанные с идентификатором клиента.Фактические имена этих столбцов будут варьироваться от таблицы к таблице.
Для этого я пытаюсь написать скрипт, который может генерировать ключевые слова на основе предоставленного слова.Например, если я передал «Идентификатор клиента» в качестве параметра скрипту, он должен сгенерировать «CUSTOMER_ID, CUST_ID, CUSTOMER_NUMBER и т. Д.»как список возможных имен столбцов.Получив список возможных имен столбцов, я могу выполнить полный поиск озера данных, чтобы найти таблицы, содержащие эти столбцы.
Я не уверен, с чего начать.Можно ли это решить с помощью НЛП или просто сопоставления с образцом?