Я пытаюсь создать Python UDF в качестве эквивалента Netezza dbl_mp в кластере Redshift.
Я вижу, что существующие пакеты Python для метафона или фонетики не работают так же, как Netezza dbl_mp.
Я пытался получить выходные данные с помощью существующих пакетов Python [Metaphone, Phonetics], и, похоже, я не получаю такой же вывод, как Netezza.Как мне этого добиться?или Как я могу сделать Аналогичный алгоритм в Python так же, как и Netezza Double Metaphone?
Было бы здорово!Если я получу какие-либо предложения или помощь по этому вопросу !!!
Заранее спасибо
#With Phonetics
import phonetics as ph
print(ph.dmetaphone('Steve'))
#With Metaphone
import metaphone as mp
print(mp.dm('Steve'))
В Netezza:
dbl_mp('Steve')
==> -852439760
В Python:
print(ph.dmetaphone('Steve'))
или print(mp.dm('Steve'))
==> ('STF', '')
"Iожидаем, что на выходе 'Steve' будет '-852439760', но фактическим является ('STF', ''). "
Netezza Logic?:
'STF'
(основной метафон) в -852439760
(целое число со знаком [от -2147483648 до 2147483647]), какова логика этого преобразования?