Я прочитал некоторые документы с textFile
и сделал flatMap
отдельных слов, добавив некоторую дополнительную информацию для каждого слова:
val col = sc.textFile(args.getOrElse("input","documents/*"))
.flatMap(_.split("\\s+").filter(_.nonEmpty))
val mapped = col.map(t => t + ": " + extraInformation())
В настоящее время я легко сохраняю это в текст
mapped.saveAsTextFile(args.getOrElse("output", "results"))
Но я не могу понять, как сохранить карту в схеме BigQuery.Все примеры, которые я видел, создают исходную коллекцию Scollection из BigQuery, а затем сохраняют ее в другой таблице, так что исходная коллекция будет [TableRow]
вместо [String]
.
Каков здесь правильный подход?Должен ли я выяснить, как преобразовать мои данные в коллекцию, которую может принять Big Query?Или я должен попытаться выяснить, как вставить этот простой текст прямо в таблицу?