Как написать наиболее эффективный код для следующей проблемы соответствия? - PullRequest
0 голосов
/ 10 июня 2019

Необходимо сопоставить налоговые записи из двух таблиц (A и B), каждая из которых имеет запись с 10 типами значений, и классифицировать их в 4 различных сегментах следующим образом:

  1. Match
  2. Несоответствие (покажите, где именно это несоответствие, и укажите приблизительные несоответствия, например, INV-200 и INV / 200)
  3. Нет в таблице A
  4. Нет в таблице B

Пока код написан, сначала в PHP (для каждого цикла), а затем в Python (с использованием панд, соединений).

Производительность плохая. Миллионы записей не могут быть обработаны.

Как это сделать?

...