Я работал с блоками данных для чтения вывода из Object2Vec в Sagemaker. Этот вывод сохраняется как jsonlines в формате .json.out
.
df_emb = spark.read.option("multiLine", True).option("mode", "PERMISSIVE").json(bucket+key)
Когда я читаю этот файл как json, он читается как поврежденная запись. Ниже скриншот.
Я могу предоставить файл, если вы знаете решение.