У меня есть большой файл Excel, который мне нужно организовать определенным образом (годы климатических данных), чтобы понять мою проблему, я создал этот простой файл Excel для вопросов. Данные выглядят примерно так:
(в основном это данные 4x4 с пустой строкой между ними), и я хочу преобразовать эти данные так:
(возьмите каждую строку данных, транспонируйте ее, а затем добавьте к ней вторую строку со значениями Nan
), используя pandas.
Проблема, с которой я столкнулся. при чтении файла с использованием file = pd.read_csv("excel data.csv")
:
- моя первая строка будет определена как заголовок.
- строка, разделяющая данные, будет преобразована в
NaN
и будет перепутал с фактическими NaN
в моих данных
Я пробовал разные функции, включая чтение / сохранение файла без индекса (index = False
), я также пробовал такие функции, как file.iloc[0].values
, file.shift(1)
, но Я не смог понять это.
Подводя итог, я хочу иметь возможность прочитать файл, используя pandas, а затем сохранить его как 1 столбец, содержащий все данные без дополнительной информации или заголовков (извините но я новичок в pandas).
РЕДАКТИРОВАТЬ: Вот как это выглядит в ноутбуке Jupyter.
Для первой проблемы header = None
работал .
Я пытался file.stack(dropna=False).reset_index()[0]
, но результаты остались такими же, как на картинке.