Отсутствие разрывов строк в ячейках после импорта электронной таблицы Excel в Pandas DataFrame - PullRequest
0 голосов
/ 31 мая 2018

Я использую Python Pandas для импорта электронной таблицы Excel ( xlsx ) в кадр данных.Электронная таблица Excel содержит текст в некоторых столбцах.Пример ячейки с многострочным текстом приведен ниже:

document belongs to family 13: 
claims are important. 
description discloses a bycicle with 3 wheels.
assigne is well known Trudi Bikes Inc.

Ячейки содержат разрывы строк.В примере 4 строки.Проблема заключается в том, что разрывы строк теряются при импорте спреда в фрейм данных.Все строки объединены в одну строку.

Насколько я знаю, Excel добавляет разрывы строк с помощью специального символа CHR (10) или чего-то подобного.

Поэтому мой вопрос: есть ли способ сохранить эти специальные символы при импорте электронной таблицы (или разрыва строки) в фрейм данных pandas? Я бы не отказался от чего-то вроде escapeпоследовательность в строке ячейки данных.

С уважением,

Vinz

1 Ответ

0 голосов
/ 31 мая 2018

Таким образом, я сохраняю \n в df:

 df = pd.read_excel(yourfile, 'Sheet1')

enter image description here

Выход:

                 col1     col2      col3
0  hello\ncome in\ngo    hello        hi
1                 bye  bye bye  bye\nbye
...