В этом случае ваш разделитель строк должен отличаться от одинарной кавычки.
Я предполагаю, что вы используете файл с разделителями-запятыми.У вас есть несколько вариантов:
- Сделать разделитель столбцов чем-то отличным от запятой.
- Сделать разделитель строк символом, которого нет в ваших данных
- Используйте выходной формат, отличный от CSV, например, Parquet или Orc
. Если вы собираетесь использовать пользовательский разделитель, я предлагаю ASCII Decimal (31) или Hex (0x1F), который специально зарезервировандля этой цели.
Если вы собираетесь использовать разделитель строк, вы можете использовать двойные кавычки (но я предполагаю, что это в ваших данных) или выбрать другой символ.
Тем не менее, мое следующее предположение состоит в том, что вы столкнетесь с данными со встроенными возвратами каретки, и это вызовет еще один уровень проблем.По этой причине я предлагаю вам перенести ваши выдержки в нечто иное, чем CSV, и посмотреть на Паркет или Орка.