Вы можете использовать subString
встроенную функцию как
Scala
import org.apache.spark.sql.functions._
df.filter(substring(col("column_name-to-be_used"), 0, 1) === "0")
Pyspark
from pyspark.sql import functions as f
df.filter(f.substring(f.col("column_name-to-be_used"), 0, 1) == "0")
Так что вы можете подстрока, содержащая столько символов, сколько вы хотите проверить, начинается с