У меня такая ситуация:
lst = ["Apple", "Apple", "Apple small", "Orange", "FruitX", "FruitY"]
lst2 = ["Apple", "Orange", "Fruit1", "Fruit2"]
Где lst и lst2 - это серии pandas (или я должен сказать столбцы в кадре данных).
Мне нужно найти, какие значений из lst2 находятся в lst и, в конце концов, создают фрейм данных со следующими результатами (в идеале с количеством совпадающих значений и с возможностью добавления других столбцов из lst ():
lst2 lst match_count other_colum_from_lstDF other_colum_from_lstDF
Apple Apple 2 info1 info2
Apple Apple 2 info1 info2
Orange Orange 1 info1 info2
Fruit1 nan 0 nan nan
Fruit2 nan 0 nan nan
Таким образом, вы можете сопоставить несколько значений от lst до одного значения из lst2, поэтому мне нужно, чтобы результаты дублировались, как указано выше, в идеале с количеством совпадающих значений.
Я думаю, что правильным способом будет использование isin
но не смог понять как.