Дизайн - пометьте большие объемы данных банковских транзакций на основе совпадений, шаблонов или логики - PullRequest
0 голосов
/ 05 марта 2020

У нас большие объемы данных о банковских транзакциях.

Существуют различные шаблоны, такие как: 'ПРЕМИУМ КОЛЛЕКЦИЯ ДЛЯ: 12345678901' - INSURANCE_PREMIUM '00410100000099: Int.Pd: с 01-07-1900 по 30-09-1901' - FUND_TRANSFER 'NEFT / 12345678901 / HDFC / LI C IPP CEL' - LIC_PREMIUM, NEFT_TRANSFER, SAVING 'NEFT / 12345678901 / HDFC / LI C IPP CEL' - LIC_PREMIUM, NEFT_TRANSFER, SAVING 'IMPS: INW.12345678901 / CAMS' - FUND_TRANSFER, IMPS_TRANSFER 'UPI / ABCD12345678901 / UPI / продукты на эту неделю' - ПОКУПКА, ПРОДУКТЫ, UPI_PAYMENT, РАСХОДЫ 'UPI / ABCD12345678901 / CRED - Оплата счета кредитной картой' - BILL_PAYMENT, РАСХОДЫ Все эти данные хранятся в mysql прямо сейчас.

Мне нужно пометить эти типы транзакций для разных совпадений шаблонов. Как я могу построить систему, которая добавляет теги к этим транзакциям на основе совпадения / шаблона / логики c? Транзакция может иметь более одного тега.

Ограничения машины: процессор - до 32 ядер Память - до 100 гигабайт

Я ищу

  • какую базу данных вы рекомендуете?
  • Как мне начать строить вокруг этой проблемы?

Пожалуйста, дайте мне знать, если мне нужно добавить дополнительную информацию здесь.

Заранее спасибо.

...