Преобразование набора данных столбца в формат Json в Spark - PullRequest
0 голосов
/ 12 февраля 2019

spark версия - 2.2 Java 1.8

У меня есть столбец в наборе данных строкового типа, но я хочу преобразовать его в формат JSON.

Я попытался с помощью to_json метод.Это работает нормально, но добавляет дополнительные квадратные скобки в контент json, потому что внешние страницы не загружаются.

Но я пробовал в windows (локально), контент идет правильно.

Может ли кто-нибудь сообщить мне, если есть какой-либо другой способ преобразовать строку или что-либо пропущенное в метод JSON?

Input in xml file -

<english_content>
    <aTitle>abc</articleTitle>
    <result_article>abc</search_result_article>
    <content_type_container>
      <web_component>
        <webcomponent_url>text.html</webcomponent_url>
      </web_component>
      <content_type>web_component</content_type>
    </content_type_container>
    <search_result_article_desc>this is test.</search_result_article_desc>
  </english_content>

, когда я использую ниже метод to_json непосредственно на входе, он дает мне вывод с Extra Squareскобка.

 Dataset<Row> ds1 = ds.withColumn("content.serialized",to_json(col("english_content")))

сгенерированный вывод - здесь прибывает дополнительный «[».Так что он ломается в передней части.

{"Title":"abc","content_type_container":[{"content_type":"web_component","web_component":{"webcomponent_url":"text.html"}}],"result_article":"abc","search_result_article_desc":"this is test."}

Ожидаемый результат - без квадратной скобки.

{"Title":"abc","content_type_container":{"content_type":"web_component","web_component":{"webcomponent_url":"text.html"}},"result_article":"abc","search_result_article_desc":"this is test."}

Заранее спасибо.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...