Есть ли в Python эквивалентный алгоритм двойного метафона, такой же, как Netezza dbl_mp? - PullRequest
0 голосов
/ 18 апреля 2019

Я пытаюсь создать Python UDF в качестве эквивалента Netezza dbl_mp в кластере Redshift.

Я вижу, что существующие пакеты Python для метафона или фонетики не работают так же, как Netezza dbl_mp.

Я пытался получить выходные данные с помощью существующих пакетов Python [Metaphone, Phonetics], и, похоже, я не получаю такой же вывод, как Netezza.Как мне этого добиться?или Как я могу сделать Аналогичный алгоритм в Python так же, как и Netezza Double Metaphone?

Было бы здорово!Если я получу какие-либо предложения или помощь по этому вопросу !!!

Заранее спасибо

#With Phonetics
import phonetics as ph
print(ph.dmetaphone('Steve'))

#With Metaphone
import metaphone as mp
print(mp.dm('Steve'))

В Netezza:

dbl_mp('Steve') ==> -852439760

В Python:

print(ph.dmetaphone('Steve')) или print(mp.dm('Steve')) ==> ('STF', '')

"Iожидаем, что на выходе 'Steve' будет '-852439760', но фактическим является ('STF', ''). "

Netezza Logic?:

'STF' (основной метафон) в -852439760 (целое число со знаком [от -2147483648 до 2147483647]), какова логика этого преобразования?

...