Получить Pyspark Job Output на NodeJS - PullRequest
1 голос
/ 11 апреля 2020

Я успешно отправил задание Pyspark и хочу вывести результат задания.

Я получил результат задания из следующего кода:

const output = await storage
      .bucket(clusterResp.config.configBucket)
      .file(
        `google-cloud-dataproc-metainfo/${clusterResp.clusterUuid}/` +
          `jobs/${jobId}/driveroutput.000000000`
      )
      .download();

Однако результат также включает в себя все журналы задания.

Можно ли как-то просто распечатать вывод, полученный моим файлом pyspark, без какой-либо информации о регистрации?

1 Ответ

0 голосов
/ 13 апреля 2020

В соответствии с документом введите здесь , вы можете установить --driver-log-уровни для просмотра вывода драйвера / консоли для задания.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...