Преобразование таблицы Microsoft Access в CSV и / или Pandas - PullRequest
0 голосов
/ 04 августа 2020

У меня есть таблица Microsoft Access с более чем 600 000 строк и 111 столбцов. Все, что мне нужно сделать, это получить эту таблицу в формате .csv (для преобразования в Pandas df) или непосредственно в Pandas фрейм данных. Я пробовал следующее:

  1. Экспортируйте таблицу в формат .xlsx. Это дает мне рабочий лист с более чем 500 000 Кб данных, но он полностью пустой, когда я открываю его.

  2. Экспорт данных в .txt. Я сделал это, но похоже, что есть проблема с разделителями / несогласованным форматированием в таблице, которая извлекает данные, которые испорчены к тому времени, когда вы достигнете следующих столбцов (то есть некоторые столбцы все равны нулю, когда они не должны быть, когда я вытащите .txt в Pandas)

  3. Немного повозился с пакетом pyodb c, но я смог найти в основном информацию, касающуюся получения Python для доступа или управления базой данных Access через pyodb c.

Чтобы было ясно, я не собираюсь манипулировать или связываться с этой базой данных, я строго хочу получить необработанные данные, поэтому Я могу запустить его через модель случайного леса, которую я построил в Python. Простите меня, если какая-либо из моих формулировок неправильная / нечеткая, я никогда не использовал Access до сегодняшнего дня.

1 Ответ

0 голосов
/ 04 августа 2020

возможно, вы экспортируете это неправильно, вы можете проверить это здесь: https://helpcenter.volusion.com/en/articles/424479-how-to-transfer-data-between-microsoft-access-and-your-volusion-store#: ~: text = Within% 20Access% 2C% 20select% 20the% 20database,% 20following% 20pop% 2Dup% 20window .

затем откройте это с помощью panda:

pd.read_csv('data.csv')  

дополнительные параметры для csv с помощью panda: https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

...