Нахождение наибольшего совпадения между элементами списка и столбцом данных - PullRequest
1 голос
/ 08 марта 2019

Допустим, у меня есть фрейм данных (df) с двумя столбцами и списком строк (my_string).

Цель состоит в том, чтобы найти самое длинное соответствие между каждой строкой в ​​my_string и col_2 и вставить соответствующее значениеcol_1 в качестве вывода.Так, например, если:

my_string = ['289', '1', '12']

      col_1   col_2
df = [A       123
      B       230
      C       17]

Я ожидаю, что вывод должен быть [B, [A, C], A]

Пробовал функцию find_longest_match из difflib, но безуспешно.

Любая помощь будет оценена.

...