Сводка процесса, который у меня был на фрейме данных.
- я получил сумму в столбце «DamageDealt», которая была 581294667,8516002
train.damageDealt.sum()
# 581294667.8516002
train.damageDealt.shape
# (4446966,)
- я обнаружил, что в одном столбце 'winPlacePerc' было одно значение NaN
train.isnull().sum()
Id 0
groupId 0
matchId 0
assists 0
boosts 0
damageDealt 0
DBNOs 0
headshotKills 0
heals 0
killPlace 0
killPoints 0
kills 0
killStreaks 0
longestKill 0
matchDuration 0
matchType 0
maxPlace 0
numGroups 0
rankPoints 0
revives 0
rideDistance 0
roadKills 0
swimDistance 0
teamKills 0
vehicleDestroys 0
walkDistance 0
weaponsAcquired 0
winPoints 0
winPlacePerc 1
dtype: int64
- значение столбца'mageDealth 'в строке с NaN равно 0,0
train[train.winPlacePerc.isnull() == True].damageDealt
# 2744604 0.0
# Name: damageDealt, dtype: float64
- я удалил этот кортеж на
dropna()
train2 = train.copy()
train2.dropna(inplace=True)
train2[train2.winPlacePerc.isnull() == True]
# Series([], Name: damageDealt, dtype: float64)
- сумма столбца изменена на 581294667.8516004 ...! даже поднял ...!
train2.damageDealt.sum()
# 581294667.8516004
, поэтому я понятия не имею, как получился этот результат, когда удален только 0,0 кортеж столбцаmageDealt.
было бы полезно, если кто-нибудь может объяснить это.
Заранее спасибо !!