Иногда данные в формате CSV форматируются следующим образом
col1,col2,col3
a,b,"this field has an embedded quote character ("") in it"
, который предназначен для анализа как
col1 | col2 | col3
a | b | this field has an embedded quote character (") in it
То есть символ цитирования поля экранируется путем удвоения его.
Модуль Python csv.reader
прекрасно с этим справляется, если csv.Dialect.doublequote
равен True
.
Как это можно сделать в Pandas?