Я пытаюсь прочитать в файле .tsv, однако я заметил, что в моих данных есть определенная строка, которая вызывает следующую ошибку:
ParserError : Ожидается 112 полей в строке 112, видел 115
Я проследил ошибку, чтобы найти, что в моих данных есть "\\t"
, который, когда я пытаюсь прочитать в файле, думает, что он отделен от табуляции...
Я безуспешно пробовал следующее:
df = pd.read_csv('data.tsv.gz', header=None, sep='\t',
quoting=csv.QUOTE_NONE, compression='gzip', engine='python',
encoding='iso8859_1')
Я также пытался использовать: sep='^\\t|\t'
.
Пример данных:
There\tShould \\t Only\tbe\t6\tcolumns\t\t
Выходные данные в кадре данных должны содержать 6 столбцов со строкой "\\t
":
|There|Should \\t Only|be|6|columns|NA|