Question

Как я могу изменить приведенный ниже код так, чтобы он извлекал только последнюю строку в таблице, в частности значение в столбце key?Причина в том, что это огромная таблица, и мне нужна последняя строка, в частности значение ключа, чтобы узнать, сколько он загружен на данный момент.Меня не волнует, какое еще содержание.

Строка 1:

val df = spark.sqlContext.read.format("datasource").option("project", "character").option("apiKey", "xx").option("type", "tables").option("batchSize", "10000").option("database", "humans").option("table", "healthGamma").option("inferSchema", "true").option("inferSchemaLimit", "1").load()

Строка 2:

df.createTempView("tables")

Строка 3:

spark.sqlContext.sql("select * from tables").repartition(1).write.option("header","true").parquet("lifes_remaining")

Yash Shah · Answer 1 · 05 декабря 2018

вы можете использовать orderBy в таком фрейме данных, надеюсь, это поможет:

df.orderBy($"value".desc).show(1)

Scala Spark читает последнюю строку только под конкретным столбцом

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Scala Spark читает последнюю строку только под конкретным столбцом

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов