Подведение итогов столбца - PullRequest
0 голосов
/ 22 марта 2020

У меня есть фрейм данных с именем Votes, и я пытаюсь выяснить, сколько пропущенных значений в фрейме данных, представленном как '?'. Фрейм данных имеет header=none, поэтому заголовки столбцов перечислены как 0, 1, 2 et c. Я использовал следующий код:

Empty = Votes.loc[:,:] == '?' 

, чтобы найти пропущенные данные, а затем подвести итоги по столбцам, чтобы создать логическое значение для поиска пропущенных данных. Я хотел бы суммировать подсчеты столбцов, которые указывают отсутствующее значение, чтобы увидеть, сколько пропущенных значений содержится в кадре данных. Я использовал код:

sum(Empty.sum())

, чтобы получить сумму, но не смог сделать это по столбцу. Как я могу найти общее количество, суммируя подсчеты по столбцам?

1 Ответ

0 голосов
/ 22 марта 2020

Практически просто делайте то, что вы пытались сделать, но делайте это для каждого столбца, а не для всего DataFrame. dict может быть хорошим способом организовать это:

import pandas as pd

df = pd.DataFrame({
    0:[1,2,'?',4,5,'?',7],
    1:['?',2,'?',4,'?',6,7],
    2:['?',2,'?',4,5,'?','?'],
})

empty = {c:(df[c] == '?').sum() for c in df.columns}

for k,v in empty.items():
    print(f'Column {k} has a total of {v} missing values.')

Пример В Python Репетитор

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...