Я пытаюсь прочитать небольшой файл как набор данных, но он выдает ошибку
"Невозможно преобразовать ordId
из строки в int, так как это может усечь".
Вот код:
object Main {
case class Orders(ordId: Int, custId: Int, amount: Float, date: String)
def main(args : Array[String]): Unit ={
val schema = Encoders.product[Orders].schema
val spark = SparkSession.builder
.master ("local[*]")
.appName ("")
.getOrCreate ()
val df = spark.read.option("header",true).csv("/mnt/data/orders.txt")
import spark.implicits._
val ds = df.as[Orders]
}
}
orders.txt
ordId,custId,amount,date
1234,123,400,20190112
2345,456,600,20190122
1345,123,500,20190123
3456,345,800,20190202
5678,123,600,20190203
6578,455,900,20190301
Как устранить эту ошибку ?. Также я хотел бы знать, что мне сначала нужно прочитать файл как Dataframe, а затем преобразовать в набор данных?