Вы можете использовать Talend Open Studio для этой задачи. Это открытый ETL-инструмент для манипулирования данными и интеграции. Вы можете, например, ImportCSV >> DATABASE >> выполнить преобразования >> ExportCSV. Возможности бесконечны.
Вы можете найти его здесь: http://www.talend.com/products-data-integration/talend-open-studio.php
Звучит так, как будто вы хотите создать профиль данных. Для этого вы можете использовать Talend Open Profiler, недавно они добавили поддержку плоских файлов, таких как ваш .csv. Он прост в использовании, и вы должны начать работу через 30 минут.
Скачать можно здесь: http://www.talend.com/products-data-quality/talend-open-profiler.php
Вы можете найти здесь несколько уроков: http://www.talendforge.org/tutorials/menu.php
В руководствах выберите вкладку «Качество данных» и прокрутите вниз до «Talend Open Profiler»
Это мой первый шаг в оценке качества данных для нового набора данных.