Использование панд для чтения Excel со столбцом типа переменной - PullRequest
0 голосов
/ 14 февраля 2019

Я работаю над автоматизацией внутренней обработки данных Python для набора данных Excel, предоставленного моей системе.Один из столбцов должен быть отформатирован как текст, содержащий буквенно-цифровые символы вместе с разделителями дефиса ('-') и точки ('.').

Excel автоматически форматирует этот столбец и преобразует два числовых значения, разделенных знакомдефис как дата.Поэтому, когда я пытаюсь загрузить библиотеку Pandas с помощью read_excel (), она использует форматирование Excel и вызывает нежелательное поведение.

Например: 05 апреля 2019 г. введено как "4-5", автоматически преобразуется в "5 апреля », но я хочу, чтобы он оставался как« 4-5 ».Конечно, я мог бы просто открыть файл вручную и изменить столбец на текстовый, но это противоречит цели полной автоматизации.

Используя pandas.read_excel (), столбец dtype = object.Я пытался преобразовать в str, но он просто сохраняет формат Excel.Затем я попытался преобразовать в int, за которым следует str, но буквенные символы выдают ошибку.

Можно ли сделать эту работу с необработанным файлом Excel в Python или мне нужно спросить владельца источника данных?форсировать желаемое форматирование?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...