Python Pandas Создать Dataframe - PullRequest
       1

Python Pandas Создать Dataframe

0 голосов
/ 01 декабря 2018

У меня есть код, использующий метку, а затем горячее кодирование.После этого мы создаем DataFrame.Есть еще другие способы создания имен столбцов просто, но я просто хочу понять эти коды ниже.new_poke_df - это существующий фрейм данных, и мы просто объединяем этот фрейм данных с нашими новыми функциями, созданными с помощью быстрого кодирования.Эти новые функции являются;new_gen_features, new_leg_features.

  1. Я обычно использую сумму для числовых значений, но здесь она используется со строковыми метками.Какова причина и следствие функции Sum () в этом примере
  2. В конце также есть две квадратные скобки.В чем причина?

Я также добавил ссылку на свой github, если кому-то интересно все коды (https://github.com/ibozkurt79/practical-machine-learning-with-python/blob/master/notebooks/Ch04_Feature_Engineering_and_Selection/Feature%20Engineering%20on%20Categorical%20Data.ipynb)

new_poke_ohe = pd.concat([new_poke_df, new_gen_features, new_leg_features], 
axis=1)    
columns = sum([['Name', 'Generation', 'Gen_Label'], 
           gen_feature_labels,
           ['Legendary', 'Lgnd_Label'], leg_feature_labels], [])    
new_poke_ohe[columns]

1 Ответ

0 голосов
/ 01 декабря 2018

sum(list_of_list, []) - это питонский способ выравнивания списка списка.

См. Этот пример:

list_of_list = [['A','B','C'],['D'],['E','F','G','H']]
sum(list_of_list, [])

Вывод:

['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H']

Обратите внимание, какВаш 2D массив, список списка, теперь является 1D списком.

[] указывает сумму, что начальный объект, к которому нужно добавить, является пустым списком. цитата из @ piRSquared

Итак, здесь происходит то, что вы создаете новый список столбцов из различных меньших списков столбцов из кадров данных в вашем pd.concat.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...