У меня есть простое приложение, которое открывает текстовый файл с разделителями табуляции и вставляет эти данные в базу данных.
Я использую этот CSV-ридер для чтения данных: http://www.codeproject.com/KB/database/CsvReader.aspx
И все работает просто отлично!
Теперь мой клиент добавил новое поле в конец файла, которое называется «ClaimDescription», и в некоторых из этих описаний претензий данные содержат кавычки, например:
"SUMISEI MARU NO 2" - Японское море
Это, кажется, вызывает сильную головную боль для моего приложения. Я получаю исключение, которое выглядит так:
CSV, по-видимому, поврежден рядом с полем «1470» записи 26 в позиции «181». Текущие необработанные данные: ...
И в этих «необработанных данных», конечно же, в поле описания заявки отображаются данные с кавычками.
Я хочу знать, сталкивался ли кто-нибудь с этой проблемой раньше, и обошел ли ее?
Очевидно, что я могу попросить клиента изменить данные, которые он мне первоначально отправил, но это автоматизированный процесс, который они используют для создания файла с разделителями табуляции; и я бы предпочел использовать это в качестве крайней меры.
Я думал, что мог бы, возможно, открыть файл с помощью стандартного TextReader перед этим, избежать любых кавычек, записать содержимое обратно в новый файл, а затем передать этот файл в CSV Reader. Вероятно, стоит упомянуть, что средний размер этих файлов с разделителями табуляции составляет около 40 МБ.
Любая помощь очень ценится!
Ура, Шон