Я только начал работу над квалификацией платформы больших данных, и я хотел бы получить предложения о том, как проверить производительность чтения и записи в формате hdf.
Если вы запускаете задания spark для операций чтения и записи, вы можете увидеть время задания в диспетчере приложений (localhost: 50070), а если вы используете spark-shell, вам придется измерять время вручную или использовать время функция.