Я делаю процедуру однократного импорта из одной системы в другую. Первым шагом является импорт большого количества данных из множества csv-файлов. Первая строка в каждом csv-файле - это разделенные табуляцией имен полей. Остальные данные также разделены табуляцией и строки разделены символом CR.
Я написал подпрограмму из 20 строк, которая создает таблицы и считывает данные в базу данных sql. Я установил все поля, которые содержат только числовые данные и имеют «ID» в своем имени поля как INT, а остальные как NVARCHAR (255).
Теперь я хочу уточнить его, чтобы он посмотрел на данные и попытался выяснить, какие данные он содержит в каждом столбце. Здесь есть время, даты, поля id, текстовые поля и числовые поля.
Я знаю, как это сделать, это довольно просто, но я хочу знать, есть ли какая-то работа, проделанная в этой области, и есть ли классы, которые справляются с этим.
Узнать предпочтительный размер сложнее. Я думаю, что я должен
1. Просматривая все строки и узнайте самые длинные данные для каждого столбца.
2. Ищите таблицу поиска, где я отображаю, например, длину 0-50 на 100, длину 51-255 на 255 и т. Д.
У кого-нибудь есть какой-нибудь умный вклад в это? Как я уже сказал, это не является чем-то особенно сложным, но было бы неплохо создать из этого умную библиотеку, чтобы позже использовать ее в других сценариях импорта.