www.google.co.kr это не URL, это часть URL, часть HOST. Например, URI будет: Разделить URL-адрес веб-сайта на несколько столбцов на scala фрейм данных
. Вы можете получить задачу следующим образом.
myDf.createOrReplaceTempView("table")
sqlContext.sql("""
SELECT url,
IF(SIZE(SPLIT(url,'\\.')) > 1, SPLIT(url,'\\.')[0], 'NA') as Col1,
IF(SIZE(SPLIT(url,'\\.')) > 2, SPLIT(url,'\\.')[1], 'NA') as Col2,
IF(SIZE(SPLIT(url,'\\.')) > 3, SPLIT(url,'\\.')[2], 'NA') as Col3,
.....
IF(SIZE(SPLIT(url,'\\.')) > 6, SPLIT(url,'\\.')[5], 'NA') as Col6
FROM table
""")
Я надеюсь, что это дает вам несколько подсказок,
С уважением.