Данные обычно отображаются в текстовом файле в следующем формате:
Поле1 вкладка Поле2 вкладка Поле3 вкладка Поле4 вкладка Поле 5 вкладка Поле 6 вкладка Поле 7 вкладка Поле 8 вкладка Поле 9 CRLF
Где поля имеют различную длину и могут содержать пробелы или даже начинаться и заканчиваться пробелами. Между 9 полями всегда должно быть 8 вкладок.
Однако иногда я нахожу строку, которая разбита следующим образом:
Поле 1 Вкладка F ie CR | LF
ld2 tab Field3 tab Field4 tab Field5 tab Field6 tab Field7 tab Field8 tab Field9 CRLF
В notepad ++ я вижу, что каждая строка заканчивается возвратом каретки и перевод строки CRLF (т. е. \ r \ n)
Произошло непреднамеренное разделение строки данных с помощью CR или LF.
Конечная цель - импортировать данные в MS SQL таблица данных сервера.
Есть миллион строк, поэтому мне нужно исправить это эффективным способом.
Есть идеи?
Спасибо !!
ОБНОВЛЕНИЕ:
Я думаю, я понял это:
Я пробовал это в блокноте ++ с помощью регулярного выражения
Чтобы исправить разрывы строк с переводом строки
Найти: (^ [^ \ r \ n] *) \ n
Repla ce: (\ 1)
Чтобы исправить разрывы строк с возвратом каретки
Найти: (^ [^ \ r \ n] *) \ r
Заменить: (\ 1)
* фактически этот второй удаляет CRLF с конца каждой строки и заменяет его одним LF, но, похоже, работает для моих целей.