Мне нужно импортировать табличные данные в мою базу данных. Данные поступают через электронные таблицы (в основном файлы Excel) от нескольких сторон. Формат каждого из этих файлов похож, но не одинаков, и для преобразования данных в конечный формат, пригодный для импорта, потребуются различные преобразования. Кроме того, форматы ввода могут измениться в будущем. Я ищу инструмент, который может запускаться и администрироваться обычными пользователями для преобразования входных файлов.
Теперь позвольте мне перечислить некоторые преобразования, которые я собираюсь сделать:
Ввод:
|Name|Category|Price|
|data|data |data |
Выход
|Name|Price|Category|
|data|data |data |
Ввод:
|PRODUCTNAME|CAT |PRICE|
|data |data|data |
Выход
|Name|Category|Price|
|data|data |data |
- сопоставить столбцы в соответствии с таблицей поиска, как в приведенных выше примерах:
заменить каждое вхождение строки «Автомобиль» на «автомобиль» в столбце Категория
- базовая математика:
умножьте столбец цены на некоторый коэффициент
- основные манипуляции со строками
Допустим, формат столбца «Цена» - «3 x 45 долларов», я хотел бы разделить его на два столбца суммы и цены
- фильтрация строк по значению: исключить все строки, содержащие слово «дорогой»
- и т.д.
У меня есть следующие требования:
- может работать на любой из следующих платформ: Windows, Mac, Linux
- Open Source, Freeware, Shareware или коммерческий
- преобразования должны быть доступны для редактирования через графический интерфейс
- если инструмент требует обучения конечного пользователя, что не является проблемой
- может обрабатывать порядка 1000-50000 строк
В основном я ищу графический инструмент, который поможет пользователям нормализовать данные, чтобы их можно было импортировать, без необходимости писать кучу адаптеров.
Какие инструменты вы используете для решения этой проблемы?