У меня есть большая коллекция данных в файле Excel (и CSV-файлы). Данные должны быть помещены в базу данных (MySQL). Однако, прежде чем он попадет в базу данных, его необходимо обработать ... например, если столбцы 1 меньше столбца 3, добавьте 4 в столбец 2. Перед сохранением информации необходимо соблюдать несколько правил.
Каким будет хороший дизайн для выполнения этой задачи? (с использованием Java)
Дополнительные примечания
Процесс должен быть автоматизирован. В том смысле, что мне не нужно вручную входить и изменять данные. Мы говорим о тысячах строк данных с 15 столбцами информации на строку.
В настоящее время у меня есть своего рода дизайн цепочки ответственности. Один класс (Java) для каждого правила. Когда одно правило выполнено, оно вызывает следующее правило.
Подробнее
Как правило, имеется около 5000 строк на лист данных. Скорость не является большой проблемой, потому что
этот большой ввод не часто происходит.
Я рассматривал слюни, но не был уверен, что задача была достаточно сложной для дролов.
Пример правил:
Вся валюта (данные в определенных столбцах) не должна содержать символы валют.
Названия категорий должны быть одинаковыми (например, книжный шкаф = книжный шкаф)
Даты ввода не могут быть будущими датами
Ввод текста может содержать только [A-Z 0-9 \ s]
и т.д ..
Кроме того, если какой-либо столбец информации является недействительным, об этом необходимо сообщить, когда
обработка завершена
(или, возможно, прекратить обработку).
Мое текущее решение работает. Однако я думаю, что есть возможности для улучшения, поэтому я ищу
для идеалов относительно того, как это может быть улучшено и или как другие люди обращались с подобным
ситуаций.
Я рассматривал (очень кратко) использование слюней, но я не был уверен, что работа была достаточно сложной, чтобы воспользоваться преимуществами слюней.