У меня есть записи, подобные приведенным ниже.
Разделенные пробелами / разделенные:
2015-07-22 5555 9999 "abc bbc 777" "FFF/5.0 (NTFS NT 6.1)"
2015-07-16 1111 7777 "7873 b34 bt57" "77/99 (TT; 420; ty:39.0) aa/11.0"
Я хотел бы знать, есть ли прямой способ разделения / разделения полей 4 и 5 в случае, еслиони заключаются в двойные кавычки с использованием sc.textfile и spark.read.format ()?
Ожидаемый результат:
-------------------------------------------------------------------------------------------------
Date |Value1 |Value2 |Value3 |Value3 |
-------------------------------------------------------------------------------------------------
2015-07-22 |5555 |9999 |abc bbc 777 |FFF/5.0 (NTFS NT 6.1)
2015-07-16 |1111 |7777 |7873 b34 bt57 |77/99 (TT; 420; ty:39.0) aa/11.0 |
-------------------------------------------------------------------------------------------------
Если решение, подобное этому, уже существует, укажите это.Любая помощь будет высоко ценится!