Проблема выбора семенных данных в глубоком обучении, которая порождает написание - PullRequest
0 голосов
/ 14 июня 2019

библиотека (keras) библиотека (stringr) путь <- get_file ( "Nietzsche.txt", origin = "<a href="https://s3.amazonaws.com/text-datasets/nietzsche.txt" rel="nofollow noreferrer">https://s3.amazonaws.com/text-datasets/nietzsche.txt" ) это проблема text <- tolower (readChar (путь, file.info (путь) $ размер)) cat ("Длина корпуса:", nchar (текст), "\ n") </p>

  # Select a text seed at random
  start_index <- sample(1:(nchar(text) - maxlen - 1), 1)  
  seed_text <- str_sub(text, start_index, start_index + maxlen - 1)

  cat("--- Generating with seed:", seed_text, "\n\n")

  for (temperature in c(0.2, 0.5, 1.0, 1.2)) {

    cat("------ temperature:", temperature, "\n")
    cat(seed_text, "\n")

    generated_text <- seed_text

    # We generate 400 characters
    for (i in 1:400) {

      sampled <- array(0, dim = c(1, maxlen, length(chars)))
      generated_chars <- strsplit(generated_text, "")[[1]]
      for (t in 1:length(generated_chars)) {
        char <- generated_chars[[t]]
        sampled[1, t, char_indices[[char]]] <- 1
      }

      preds <- model %>% predict(sampled, verbose = 0)
      next_index <- sample_next_char(preds[1,], temperature)
      next_char <- chars[[next_index]]

      generated_text <- paste0(generated_text, next_char)
      generated_text <- substring(generated_text, 2)

      cat(next_char)
    }
    cat("\n\n")
  }
}

Текстовый код глубокого обучения. Я хотел бы использовать текст, который я указал, вместо выбора случайного начального текста здесь. Как я могу изменить это? Кроме того, мне действительно нужно писать и указывать текст в get_file () при первом импорте файла?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...