Предположим, что у нас есть следующий кадр данных панд
import pandas as pd
data_dic = {
"values": ['jk4', '293','814' ,'er b3', '1', " sas", '<', '37', '/',3, '5651 + sdfv 84083', '+', '814 gfj67 340f', "sas " ,'293', '<', 'df gfdh', ' .', ':9271', '1', '3-', '=', '5', '293', "sas "],
"rowNr": [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24]
}
data = pd.DataFrame(data_dic)
с учетом конкретной строки, как мы можем получить идентификаторы строк, которые лучше всего соответствуют? например, допустим, что входная строка была: " sas 293 <"
, тогда выходные идентификаторы были бы [13,14,15]
, что соответствует наилучшему совпадению в этом кадре данных.
Пример 2: для входной строки "814 gfj67 340f "
вывод будет [12]
Пример 3: для входной строки ". :92711"
результат будет [17,18,19]