разные суммы () результат из того же столбца в Python - PullRequest
0 голосов
/ 15 января 2019

Сводка процесса, который у меня был на фрейме данных.

  1. я получил сумму в столбце «DamageDealt», которая была 581294667,8516002

train.damageDealt.sum()
# 581294667.8516002

train.damageDealt.shape
# (4446966,)
  1. я обнаружил, что в одном столбце 'winPlacePerc' было одно значение NaN

train.isnull().sum()
        Id                 0
    groupId            0
    matchId            0
    assists            0
    boosts             0
    damageDealt        0
    DBNOs              0
    headshotKills      0
    heals              0
    killPlace          0
    killPoints         0
    kills              0
    killStreaks        0
    longestKill        0
    matchDuration      0
    matchType          0
    maxPlace           0
    numGroups          0
    rankPoints         0
    revives            0
    rideDistance       0
    roadKills          0
    swimDistance       0
    teamKills          0
    vehicleDestroys    0
    walkDistance       0
    weaponsAcquired    0
    winPoints          0
    winPlacePerc       1
    dtype: int64

  1. значение столбца'mageDealth 'в строке с NaN равно 0,0

train[train.winPlacePerc.isnull() == True].damageDealt
#        2744604    0.0
#    Name: damageDealt, dtype: float64

  1. я удалил этот кортеж на dropna()

train2 = train.copy()
train2.dropna(inplace=True)
train2[train2.winPlacePerc.isnull() == True]
# Series([], Name: damageDealt, dtype: float64)

  1. сумма столбца изменена на 581294667.8516004 ...! даже поднял ...!

train2.damageDealt.sum()
# 581294667.8516004

, поэтому я понятия не имею, как получился этот результат, когда удален только 0,0 кортеж столбцаmageDealt. было бы полезно, если кто-нибудь может объяснить это. Заранее спасибо !!

...