Как сравнить 2D-данные с помощью нечеткого алгоритма - PullRequest
0 голосов
/ 13 марта 2020
    import pandas as pd
    cols = [0, 3]
    import pandas as pd

    fbr_cols = [0, 3]
    df = pd.read_excel('Book1.xlsx' ,sheet_names='fbr_Data', usecols=fbr_cols)


   sapphire_matrix = df.as_matrix()

   print(type(sapphire_matrix))


   fbr_cols = [0, 3]
   df_fbr = pd.read_excel('vendor data.xlsx' ,sheet_names='fbr_Data', usecols=fbr_cols)


   fbr_matrix = df_fbr.as_matrix()

   print(type(vendor_matrix)


  from fuzzywuzzy import fuzz
  from fuzzywuzzy import process

  def compare_columns(array1, array2): 

    if len(array1) != len(array2):
        return False # If row numbers are not same, return false

    for row_number in range(len(array1)):
        if fuzz.partial_ratio(array1[row_number][:] , array2[row_number][:]):
            return False # If the content is not equal, return false

    return True # All of the content is equal, the return true

array1 = sapphire_matrix
array2 = fbr_matrix

array3 = []       
if compare_columns(array1, array2):
       array3.append('matches: {!r}'.format(array1))
print(array3) 

Я хочу сравнить Vendor_Name с другим Vendor_Name и таким же для номера NTN, я использую массивы numpy, но я не могу понять, как сравнить их с совпадением в шкафу с помощью нечеткого алгоритма и проверить, если Vendor_Name а NTN выходит из другого списка или нет. Ценю ваш вклад.

...