Как сделать файлы базы данных maxmind внутри кластера pyspark - PullRequest
0 голосов
/ 26 октября 2018

Я использую файлы базы данных maxmind для поиска по ip. Я использую город и базу данных isp. Проблема в том, что в локальной среде это работает, но при настройке этого в кластере искр (aws EMR) и выполнении поиска с использованием dataframe udf, это не работает. Могу ли я установить путь к корзине S3 из кластера, и смогут ли рабочие \ внешние узлы выполнить поиск по ней? Как я могу настроить поиск для maxmind-db в работе spark?

...