Обработка двух файлов с различной степенью исключения Python 3 - PullRequest
0 голосов
/ 26 марта 2019

Я хочу взять два текстовых файла и записать / добавить их в один файл.Каждый файл имеет свой разделитель.Есть ли способ легко обнаружить делюкацию?Или простой способ справиться с этой ситуацией?Как обработать удаление неизвестного файла?

Спасибо!

1 Ответ

0 голосов
/ 26 марта 2019

Нет, не существует простого способа определить неопределенный разделитель. На самом деле, можно легко построить патологические случаи, в которых разделитель неоднозначен.

Однако есть примеры из приведенных вами примеров. Похоже, что ваши поля в основном состоят из буквенно-цифровых данных (иногда включая дефисы, кавычки и т. Д.), Разделенных обычной пунктуацией. Вы можете прочитать несколько строк файла и определить вероятный разделитель по текстовым характеристикам.

Определение и свертывание буквенных полей в один символ, например A. Из оставшихся символов найдите тот, который более или менее чередуется с этими полями. Работайте с приоритетным списком рассмотрения, таким как (табуляция, запятая, пробел, ...) и вычисляйте некоторую степень соответствия, пока не получите фигуру, которая выглядит вероятной. Используйте это как разделитель для чтения файла.

После правильного ввода строк каждого файла запись файла с помощью пакета csv становится простой (см. Примеры в Интернете).

...