Я создаю Продукт через IntelliJ для программы Scala.
Я создал еще один продукт без каких-либо ошибок.
У меня не было никакой другой попытки, потому что я впервые делаю код такого типа с помощью класса / udf, я просто получил некоторую ссылку на фрагмент кода
case class Testclass(
col1:Option[java.sql.Timestamp],
col2:Option[String],
col3:Option[Int],
col4:Option[Long],
col5:Option[Double],
)
val function = udf((l: Seq[Row], id: String, ts: Timestamp) => scala.util.Try {
l
.filter(c => id.isEmpty || c.getAs[String]("order_transaction_id").equalsIgnoreCase(id))
.filter(c => if (ts != null) c.getAs[Timestamp]("jump_timestamp").before(ts) else true)
.map { c =>
Testclass(
if (!c.isNullAt(0)) Some(c.getAs[Timestamp](0)) else None,
if (!c.isNullAt(1)) Some(c.getString(1)) else None,
if (!c.isNullAt(2)) Some(c.getInt(2)) else None,
if (!c.isNullAt(3)) Some(c.getLong(3)) else None,
if (!c.isNullAt(4)) Some(c.getDouble(4)) else None
)
}
.sortWith((c1, c2) => c1.his_ts.get.before(c2.his_ts.get))
}.toOption)
val dataFrame2 = dataFrame1
.withColumn("column_ABC", function(col("event_lists"), col("event_string"), col("event_timestamp")))
//source is a parquet file, but a little similar with json format
//event_lists is an array for this parquet, all the elements are same as the definition of Testclass
//event_string is a string field
//event_timestamp is a timestamp field
Ожидаемый результат: сборка должна быть выполнена без ошибок