Генерация ключевых слов на основе шаблонов и семантики - PullRequest
0 голосов
/ 28 марта 2019

Общая цель - у меня есть озеро данных с кучей таблиц.Мне нужно автоматически определить, какие таблицы содержат столбцы, связанные с идентификатором клиента.Фактические имена этих столбцов будут варьироваться от таблицы к таблице.

Для этого я пытаюсь написать скрипт, который может генерировать ключевые слова на основе предоставленного слова.Например, если я передал «Идентификатор клиента» в качестве параметра скрипту, он должен сгенерировать «CUSTOMER_ID, CUST_ID, CUSTOMER_NUMBER и т. Д.»как список возможных имен столбцов.Получив список возможных имен столбцов, я могу выполнить полный поиск озера данных, чтобы найти таблицы, содержащие эти столбцы.

Я не уверен, с чего начать.Можно ли это решить с помощью НЛП или просто сопоставления с образцом?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...