Документация pd.read_csv
отмечает конкретные различия между двигателями 'c' (по умолчанию) и 'python'.Имена указывают язык, на котором написаны парсеры.В частности, примечание к документации:
Где возможно pandas использует синтаксический анализатор C (задан как engine='c'
), но может вернуться к Python, если указаны параметры, не поддерживаемые C.
Вот основные отличия, на которые следует обратить внимание (начиная с v0.23.4):
- «c» быстрее , тогда как «python» в настоящее время более полнофункциональный.
- «python» поддерживает
skipfooter
, а «c» - нет. - «python» поддерживает гибкие
sep
, кромеодин символ (inc regex), в то время как 'c' нет. - 'python' поддерживает
sep=None
с delim_whitespace=False
, что означает, что он может автоматически определять разделитель, в то время как«c» не поддерживает. - «c» поддерживает
float_precision
, а «python» - нет (или не требуется).
Примечания к версии:
dtype
поддерживается в 'python' v0.20.0 +. delim_whitespace
поддерживается в 'python' v0.18.1 +.
Обратите внимание, что может меняться как функцииразработаны.Вам следует проверить IO Tools (Text, CSV, HDF5,…) , если вы увидите непредвиденное поведение в более поздних версиях.