Использование панд для очистки массива данных - PullRequest
0 голосов
/ 08 марта 2019

Так что вроде как новичок здесь, но у меня есть этот набор данных, который странно переносится, я хочу вернуть его нашему парню на следующей неделе, и я довольно близко подошел к завершению - я думаю.

Проблема, с которой я сталкиваюсь, заключается в получении данных в одном фрейме данных.Когда я запускаю код и печатаю из цикла for, я вижу куски значений, которые необходимо объединить.Однако я не могу найти способ хранить все значения.когда я делаю, я просто получаю один кусок.

 import pandas as pd
 import numpy as np


 df = pd.read_excel("DATA,h",
 header = None,
 dtype = object)

 ranges = []
 last_index = 0 


def clean(df12,df13):
    df12 = df12.T
    df13 = df13.T
    value1 = pd.DataFrame(df12)
    value2 = pd.DataFrame(df13)
    final_value = value1.append(value2)
return(final_value)


for i, row in df.iterrows():
    rows = df.iloc[i]
    if rows[9] == 'Member' or rows[9] == 'Non-Pledging Member':
        if last_index == 0:
            last_index = i
        else:
            ranges.append([last_index, i])
            last_index = i
        df44 = beans(row,row)

print(df44)

когда я печатаю строки из цикла for, я получаю все необходимые значения в терминале, но если я сохраняю их в значении или в фрейме данных ... Я просто вижу один из этих блоков данных.Кто-нибудь знает, что происходит?

данные: есть 15k из этих

Proctor, Terry      206-915-3555                    Member  
620 33rd Ave E                                  16283
Seattle, WA 98112                                   

, для которых я снимаю:

 Proctor, Terry, 620 33rd Ave E, Seattle, WA, 98112, 206-915-3555, Member
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...