Я работаю над программой на C #, чтобы определить длину строки для каждой строки в нескольких больших текстовых файлах с более чем 100 000 строк перед импортом с использованием пакета служб SSIS.Я также буду проверять другие значения в каждой строке, чтобы убедиться, что они правильные, прежде чем импортировать их в мою базу данных с помощью служб SSIS.
Например, я ожидаю, что длина строки 3000 символов, а затем CR на 3001 и LF на 3002, поэтому в целом 3002 символа.
При использовании ReadLine () он читаетCR или LF как и конец строки, так что я не могу проверить символы CR или LF.Я просто проверял длину линии на 3000, чтобы определить, была ли длина правильной.Я только что столкнулся с проблемой, когда файл имеет LF в позиции 3001, но отсутствует CR.Поэтому ReadLine () говорит, что это 3000 символов, которые являются правильными, но в моем пакете служб SSIS произойдет сбой, поскольку отсутствует CR.
Я проверил, что Read () будет достигать каждого символа 1 одновременно, и яЯ могу определить, есть ли в каждой строке CR и LF, но это кажется довольно непродуктивным, и когда у некоторых файлов, с которыми я столкнусь, будет более 5 000 000 строк, это будет очень неэффективно.Затем мне нужно будет добавить каждый символ в строку или использовать ReadBlock () и преобразовать массив символов в строку, чтобы я мог проверить другие значения в строке.
Есть ли у кого-нибудь какие-либо идеи относительно эффективногоспособ проверить линию на наличие CR и LF и других значений в данной строке, не тратя лишних ресурсов и закончить относительно своевременно.