Я создал приложение, которое очищает и обогащает некоторые данные из файлов, и одновременно они доступны в виде Dataset<Row>
.
В моем идеальном мире Apache Zeppelin
сможет чтобы взять его, я бы только создал блокнот, а затем легко получил бы визуализацию данных для конечных пользователей.
Я попробовал Apache Zeppelin
в качестве демонстрационной версии, но я никогда не был внутри нее. Может ли он сделать то, что я ожидаю?
Или мое приложение обязательно сохранит результаты из Dataset<Row>
, которое оно создает, в некоторые файлы паркета, а затем Apache Zeppelin
на его стороне, если перезагрузится эти данные из этих паркетных файлов в Spark sessionContext?
Вы понимаете, что я хотел бы избежать такого шага!
Имеет Apache Zeppelin
возможность поймать "a набор данных третьей стороны "и использовать его, при условии, что он был создан той же Apache Spark
версией, которую он использует?