Pandas Dataframe имеет все столбцы данных в один столбец в один столбец - PullRequest
0 голосов
/ 12 марта 2019

Я пытаюсь загрузить некоторые данные в pandas DataFrame, но файл .txt немного странный.Он содержит круглые скобки вокруг первых пар заголовков, но не для остальных, и когда я читаю его в фрейме данных pandas, он помещает все данные и имена столбцов в первый столбец, разделенный символом «\ t», что, как я считаю, означает вкладку в python.но почему, например, он читает это так

Вот пара строк данных, скопированных из .txt файла

"Notes" "Cancer Sites"  "Cancer Sites Code" Mortality-Incidence Age-Adjusted Rate Ratio Death Counts    Mortality Population    Mortality Age-Adjusted Rate Incidence Counts    Incidence Population    Incidence Age-Adjusted Rate
    "All Cancer Sites Combined" "0" 0.385   176256  96127579    181.476 469603  96127579    470.919
    "Oral Cavity and Pharynx"   "20010-20100"   0.242   2521    96127579    2.527   10717   96127579    10.437
    "Lip"   "20010" 0.046   16  96127579    0.016   352 96127579    0.358

Вот мой код до сих пор (к вашему сведению, он делает то же самое,Я использую заголовки или нет)

df = pd.read_fwf("United States and Puerto Rico Cancer Statistics.txt", headers = None)

, и когда я печатаю df, я получаю это как заголовок ...

"Notes" "Cancer Sites"  "Cancer Sites Code" Mortality-Incidence Age-Adjusted Rate Ratio Death Counts    Mortality   Population  Mortality   Age-Adjusted    Rate    Incidence   Counts  Incidence.1 Population.1    Incidence.2 Age-Adjusted.1  Rate.1

и это как первые две строки данныхкогда я строю график df

0   "All Cancer Sites Combined"\t"0"\t0.385\t17625...   NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
1   "Oral Cavity and Pharynx"\t"20010-20100"\t0.24...   NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...