Я пытаюсь загрузить некоторые данные в pandas DataFrame, но файл .txt немного странный.Он содержит круглые скобки вокруг первых пар заголовков, но не для остальных, и когда я читаю его в фрейме данных pandas, он помещает все данные и имена столбцов в первый столбец, разделенный символом «\ t», что, как я считаю, означает вкладку в python.но почему, например, он читает это так
Вот пара строк данных, скопированных из .txt файла
"Notes" "Cancer Sites" "Cancer Sites Code" Mortality-Incidence Age-Adjusted Rate Ratio Death Counts Mortality Population Mortality Age-Adjusted Rate Incidence Counts Incidence Population Incidence Age-Adjusted Rate
"All Cancer Sites Combined" "0" 0.385 176256 96127579 181.476 469603 96127579 470.919
"Oral Cavity and Pharynx" "20010-20100" 0.242 2521 96127579 2.527 10717 96127579 10.437
"Lip" "20010" 0.046 16 96127579 0.016 352 96127579 0.358
Вот мой код до сих пор (к вашему сведению, он делает то же самое,Я использую заголовки или нет)
df = pd.read_fwf("United States and Puerto Rico Cancer Statistics.txt", headers = None)
, и когда я печатаю df
, я получаю это как заголовок ...
"Notes" "Cancer Sites" "Cancer Sites Code" Mortality-Incidence Age-Adjusted Rate Ratio Death Counts Mortality Population Mortality Age-Adjusted Rate Incidence Counts Incidence.1 Population.1 Incidence.2 Age-Adjusted.1 Rate.1
и это как первые две строки данныхкогда я строю график df
0 "All Cancer Sites Combined"\t"0"\t0.385\t17625... NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
1 "Oral Cavity and Pharynx"\t"20010-20100"\t0.24... NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN