Question

Я использую данные опроса StackOverflow для анализа, который можно найти здесь .

Теперь у меня есть кадр данных clear_df после удаления NaN и сброса индекса из исходного фрейма данных как

  index DevType ConvertedComp
0   2   Designer;Developer, back-end;Developer, front-...   8820.0
1   3   Developer, full-stack   61000.0
2   5   Data or business analyst;Data scientist or mac...   366420.0
3   8   Database administrator;Developer, back-end;Dev...   95179.0
4   9   Data or business analyst;Data scientist or mac...   13293.0

Итак, я использовал функцию разделения для формирования нового фрейма данных с разделением DevType как temp12 .

temp12 можно увидеть ниже.

level_0 level_1 0
0   0   0   Designer
1   0   1   Developer, back-end
2   0   2   Developer, front-end
3   0   3   Developer, full-stack
4   1   0   Developer, full-stack
5   2   0   Data or business analyst

Теперь я хочу объединить 'ConvertedComp' из clean_df в temp12 , используя level_0 столбец temp12 как индекс clean_df .

Ожидаемый вывод

level_0 level_1 0                         ConvertedComp
    0   0   0   Designer                  8820.0
    1   0   1   Developer, back-end       8820.0
    2   0   2   Developer, front-end      8820.0
    3   0   3   Developer, full-stack     8820.0
    4   1   0   Developer, full-stack     61000.0
    5   2   0   Data or business analyst  366420.0

Но я получаю ошибку как

TypeError: объект типа 'NoneType' не имеет len ()

Вы можете запустить приведенный ниже код, чтобы повторить ошибку, загрузив набор данных отсюда здесь :

df_2019 = pd.read_csv("dataset/developer_survey_2019/survey_results_public.csv")

def split_column_value(ori_df, column_name, separator=';'):
    '''
    INPUT - ori_df  - pandas dataframe -  original dataframe
            column_name - string - the name of the column you would like to splite the value
            separator - string - The is a delimiter. The string splits at this specified separator. If is not provided then ; is the separator.
    OUTPUT - 
            df - pandas dataframe - all value for the column of original dataframe
    '''
    ori_df = ori_df.dropna(subset=['DevType','ConvertedComp'])
    df = pd.DataFrame(ori_df[column_name].str.split(separator).tolist()).stack()
    return df

# splite the DevType colume value
temp1 = split_column_value(df_2019, 'DevType')

temp12 = pd.DataFrame(temp1).reset_index()
temp12.head(20)

clean_df=df_2019.dropna(subset=['DevType','ConvertedComp']).reset_index()[['DevType','ConvertedComp']]
clean_df

# LINE WHICH THROWS THE ERROR
merge_df = temp12.merge(clean_df, right_index=True, right_on='ConvertedComp')

Невозможно объединить два DataFrame. (TypeError: объект типа 'NoneType' не имеет len ())

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Невозможно объединить два DataFrame. (TypeError: объект типа 'NoneType' не имеет len ())

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Нет похожих вопросов