Есть ли способ добавить измененную метку времени исходного файла в качестве дополнительного столбца? - PullRequest
1 голос
/ 04 августа 2020

Я хочу узнать последнее значение для каждого заданного ключа, и у меня нет метки времени в исходном наборе данных до go by, поэтому я хотел бы использовать метку времени изменения файла в HDFS и хотелось бы выбрать только строку, которая появляется последней в этих файлах.

Есть ли способ сделать это с помощью Spark Structured Streaming?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...