Помимо прочего, у меня есть DataFrame с почтовыми индексами.Данные в качестве примера выглядят так:
Zip Item1 Item2 Item3
78264.0 pan elephant blue
73909.0 steamer panda yellow
2602.0 pot rhino orange
59661.0 fork zebra green
861893.0 sink ocelot red
77892.0 spatula doggie brown
Некоторые из этих почтовых индексов недействительны, имеют слишком много или слишком мало цифр.Я пытаюсь удалить те строки, которые имеют недопустимое количество символов / цифр (в данном случае семь символов, потому что я проверяю длину на основе str()
, и туда включается .0
).Следующий цикл lengths
:
zips = mydata.iloc[:,0].astype(str)
lengths = []
for i in zips:
lengths.append(len(i))
создает серию (не путать с Series, хотя, возможно, это - я новичок в Python) длин символов почтового индекса для каждой строки.Затем я пытаюсь установить подмножество DataFrame на основе информации из переменной lengths
.Я пробовал пару разных способов;это была последняя версия:
for i in lengths.index(i):
if mydata.iloc[i:,0] != 7:
mydata.iloc[i:,0].drop()
Естественно, это не удалось, с ошибкой ValueError: '44114.0' is not in list
.Кто-нибудь может дать какой-нибудь совет, как сделать то, что я пытаюсь сделать?