Используйте метод подстрока , как показано ниже:
import org.apache.spark.sql.functions._
import spark.implicits._
val df = Seq( (1, "abcdef"), (2, "uvwx") ).toDF("id", "value")
df.withColumn("value3", substring($"value", 1, 3)).show
// +---+------+------+
// | id| value|value3|
// +---+------+------+
// | 1|abcdef| abc|
// | 2| uvwx| uvw|
// +---+------+------+