Я придумал эту функцию, чтобы найти вероятность встретить определенный type
столбец в фрейме данных pandas, и мне интересно, есть ли более эффективный способ сделать это, чтобы структурировать, что Параметр, а не целый запрос, может быть просто именем типа def P(type = ""):
?:
#Get count of each type
type_counts = data.groupby('type').count().drop('first_word', axis = 1) #get rid of unwanted data
type_counts = type_counts.reset_index()
#Rename 'name' column to appropriate name count
type_counts.rename(columns = {'name':'count'}, inplace = True)
#Types: company, drug, movie, person, place
prob_company = P(data.query('type =="company"'))
prob_drug = P(data.query('type =="drug"'))
prob_movie = P(data.query('type == "movie"'))
prob_person = P(data.query('type == "person"'))
prob_place = P(data.query('type == "place"'))
prob_company + prob_drug + prob_movie + prob_person + prob_place