Question

Я прочитал CSV-файл, в котором есть повторяющийся столбец.

Я хочу сохранить имя столбца в кадре данных.

Я попытался добавить эту опцию в свой конфронтекст conf spark.sql.caseSensitive и поместил его true , но, к сожалению, он не действует.

Повторяющееся имя столбца NU_CPTE. Spark попытался переименовать его, добавив номер столбца 0, 7

SparkSession spark= SparkSession
                .builder()
                .master("local[2]")
                .appName("Application Test")
                .getOrCreate();    

spark.sparkContext().getConf().set("spark.sql.caseSensitive","true"); 

Dataset<Row> df=spark.read().option("header","true").option("delimiter",";").csv("FILE_201701.csv");

df.show(10);

Я хочу получить что-то подобное в результате:

Kamu · Answer 1 · 04 июня 2019

Искра исправлена, чтобы разрешить повторяющиеся имена столбцов с добавленным номером. Следовательно, вы получаете числа, добавленные к повторяющимся именам столбцов. Пожалуйста, найдите ссылку ниже

https://issues.apache.org/jira/browse/SPARK-16896

TheWhiteRabbit · Answer 2 · 04 июня 2019

Способ, которым вы пытаетесь установить свойство caseSensitive, действительно будет неэффективным.Попробуйте заменить:

spark.sparkContext().getConf().set("spark.sql.caseSensitive","true");

на:

spark.sql("set spark.sql.caseSensitive=true");

Однако это все равно предполагает, что ваши исходные столбцы имеют некоторую разницу в регистре.Если у них одинаковый корпус, они все равно будут идентичны и будут дополнены номером столбца.

Дублирующее имя столбца в спарк-чтении CSV

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Дублирующее имя столбца в спарк-чтении CSV

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы