Есть ли более эффективный способ отформатировать эту функцию - PullRequest
0 голосов
/ 17 марта 2020

Я придумал эту функцию, чтобы найти вероятность встретить определенный type столбец в фрейме данных pandas, и мне интересно, есть ли более эффективный способ сделать это, чтобы структурировать, что Параметр, а не целый запрос, может быть просто именем типа def P(type = ""):?:

#Get count of each type
type_counts = data.groupby('type').count().drop('first_word', axis = 1) #get rid of unwanted data
type_counts = type_counts.reset_index()
#Rename 'name' column to appropriate name count
type_counts.rename(columns = {'name':'count'}, inplace = True)
#Types: company, drug, movie, person, place

prob_company = P(data.query('type =="company"'))
prob_drug = P(data.query('type =="drug"'))
prob_movie = P(data.query('type == "movie"'))
prob_person = P(data.query('type == "person"'))
prob_place = P(data.query('type == "place"'))

prob_company + prob_drug + prob_movie + prob_person + prob_place
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...