У нас большие объемы данных о банковских транзакциях.
Существуют различные шаблоны, такие как: 'ПРЕМИУМ КОЛЛЕКЦИЯ ДЛЯ: 12345678901' - INSURANCE_PREMIUM '00410100000099: Int.Pd: с 01-07-1900 по 30-09-1901' - FUND_TRANSFER 'NEFT / 12345678901 / HDFC / LI C IPP CEL' - LIC_PREMIUM, NEFT_TRANSFER, SAVING 'NEFT / 12345678901 / HDFC / LI C IPP CEL' - LIC_PREMIUM, NEFT_TRANSFER, SAVING 'IMPS: INW.12345678901 / CAMS' - FUND_TRANSFER, IMPS_TRANSFER 'UPI / ABCD12345678901 / UPI / продукты на эту неделю' - ПОКУПКА, ПРОДУКТЫ, UPI_PAYMENT, РАСХОДЫ 'UPI / ABCD12345678901 / CRED - Оплата счета кредитной картой' - BILL_PAYMENT, РАСХОДЫ Все эти данные хранятся в mysql прямо сейчас.
Мне нужно пометить эти типы транзакций для разных совпадений шаблонов. Как я могу построить систему, которая добавляет теги к этим транзакциям на основе совпадения / шаблона / логики c? Транзакция может иметь более одного тега.
Ограничения машины: процессор - до 32 ядер Память - до 100 гигабайт
Я ищу
- какую базу данных вы рекомендуете?
- Как мне начать строить вокруг этой проблемы?
Пожалуйста, дайте мне знать, если мне нужно добавить дополнительную информацию здесь.
Заранее спасибо.