задание mapreduce для пряжи, завершенной с помощью exitCode: -1000 из-за изменения ресурса в файловой системе src - PullRequest
0 голосов
/ 19 марта 2019
    Application application_1552978163044_0016 failed 5 times due to AM Container for appattempt_1552978163044_0016_000005 exited with exitCode: -1000

Диагностика:

java.io.IOException: ресурс abfs: //xxx@xxx.dfs.core.windows.net/hdp/apps/2.6.5.3006-29/mapreduce / mapreduce.tar.gz изменен в файловой системе src (ожидалось 1552949440000, было 1552978240000 Сбой при попытке. Сбой приложения.

1 Ответ

0 голосов
/ 25 марта 2019

Судя по тому, что хранилище Azure не может сохранить исходную метку времени скопированного файла, оно основано только на информации об исключении. Я искал обходной путь, который рекомендовал изменить исходный код yarn-common, чтобы отключить блок кода проверки временных меток при копировании файла, чтобы избежать исключений, чтобы работа MR продолжалась непрерывно.

Вот исходный код в последней версии yarn-common, который проверяет метку времени для скопированного файла и выдает исключение.

/** #L255
   * Localize files.
   * @param destination destination directory
   * @throws IOException cannot read or write file
   * @throws YarnException subcommand returned an error
   */
  private void verifyAndCopy(Path destination)
      throws IOException, YarnException {
    final Path sCopy;
    try {
      sCopy = resource.getResource().toPath();
    } catch (URISyntaxException e) {
      throw new IOException("Invalid resource", e);
    }
    FileSystem sourceFs = sCopy.getFileSystem(conf);
    FileStatus sStat = sourceFs.getFileStatus(sCopy);
    if (sStat.getModificationTime() != resource.getTimestamp()) {
      throw new IOException("Resource " + sCopy +
          " changed on src filesystem (expected " + resource.getTimestamp() +
          ", was " + sStat.getModificationTime());
    }
    if (resource.getVisibility() == LocalResourceVisibility.PUBLIC) {
      if (!isPublic(sourceFs, sCopy, sStat, statCache)) {
        throw new IOException("Resource " + sCopy +
            " is not publicly accessible and as such cannot be part of the" +
            " public cache.");
      }
    }

    downloadAndUnpack(sCopy, destination);
  }
...