Нет, не существует простого способа определить неопределенный разделитель. На самом деле, можно легко построить патологические случаи, в которых разделитель неоднозначен.
Однако есть примеры из приведенных вами примеров. Похоже, что ваши поля в основном состоят из буквенно-цифровых данных (иногда включая дефисы, кавычки и т. Д.), Разделенных обычной пунктуацией. Вы можете прочитать несколько строк файла и определить вероятный разделитель по текстовым характеристикам.
Определение и свертывание буквенных полей в один символ, например A
. Из оставшихся символов найдите тот, который более или менее чередуется с этими полями. Работайте с приоритетным списком рассмотрения, таким как (табуляция, запятая, пробел, ...) и вычисляйте некоторую степень соответствия, пока не получите фигуру, которая выглядит вероятной. Используйте это как разделитель для чтения файла.
После правильного ввода строк каждого файла запись файла с помощью пакета csv
становится простой (см. Примеры в Интернете).