Я работаю с обработкой Scala Stream, у меня есть список событий, и я пытаюсь подсчитать вхождения каждой даты в этом формате (dd-mm-yyyy
)
это моё определение класса дела:
case class Event(prId: Int, author: String, event: String, timestamp: Date)
Мое решение заключается в следующем
def CountOccur(events: DataStreaming[Event]): DataStreaming[(String, Int)] = {
events.map(c => (c.timestamp, 1)).keyBy(x => x._1).timeWindow(Time.seconds(5)).sum(1)
}
Предположим, что вы должны ответить так:
2010-09-25,10
2010-09-27,7
.
.
.
проблема, с которой я столкнулся сейчас, заключается в том, что timestamp
имеет date format
, но мне нужно string
.
как я могу изменить это только на дату в строковом формате?
исправлено:
Вот как вы можете решить эту проблему:
events.map(c => (sdf.format(c.timestamp), 1)).keyBy(x => sdf.format(x._1)).window(EventTimeSessionWindows.withGap(Time.seconds(10))
но проблема в том, что теперь он ничего не возвращает !!