Является ли MLeap на самом деле сериализация "формат"? - PullRequest
0 голосов
/ 10 января 2019

Я начал работать с MLeap в качестве инструмента сериализации, который позволяет сохранять модель в Spark или scikit-learn и загружать ее для вывода, используя MLeap Runtime . Это работает хорошо.

Теперь моя цель - загрузить модель, сохраненную с помощью MLeap, в мой Java-код, в мои собственные структуры без MLeap Runtime. Я немного исследовал и не нашел никаких «определений формата» «схемы», только примеры, показывающие, как некоторые сериализованные модели выглядят. С этой точки зрения, похоже, что MLeap - это всего лишь инструмент сериализации / десериализации, а не «формат», как заявлено на главной странице документации.

Итак, MLeap - это «формат» или просто инструмент сериализации? Можно ли где-нибудь найти определение формата или схему?

И снова, моя цель - понять, возможно ли написать собственный инструмент сериализации / десериализации для формата MLeap или единственный вариант - использовать для этого инструменты MLeap?

1 Ответ

0 голосов
/ 15 января 2019

Я бы сказал, что Mleap - это фреймворк для запуска моделей в производство без дополнительных затрат на фреймворки, в которых вы их обучали. Это приводит к желаемой низкой задержке. Де-сериализация, безусловно, является важной частью этого, и вы на самом деле получили некоторую свободу хранить свои конвейеры.

Я рекомендую взглянуть на пакеты, которые вы создаете (zip-файлы), используя Mleap, которые содержат экспортированные конвейеры. Большинство сериализаций легко понять: логистическая регрессия содержится, например, в jsonfile, который имеет идентификатор элемента конвейера и коэффициенты. В основном то, что определяет модель логистической регрессии.

...