Преобразовать строку в список списка - PullRequest
1 голос
/ 07 ноября 2019

Ввод (строка):

[[0_busswvan, 24.0, 2019-09-05 20:15:33],[05f9acb08d7c11e89e8fede614b72917, 20.0, 2019-09-05 14:06:32], [0_h2qbu9h3, 28.0, 2019-09-05 14:01:20],[2_busswvan, 24.0, 2019-09-05 20:15:33],[05f9acb08d7c11e89e8fede614b72917, 25.0, 2019-08-12 14:06:32], [1442qbu9h3, 28.0, 2019-09-05 14:01:20]]

Я хочу преобразовать эту строку в список списков с типом: List[List[String,Double,String]]

Каков наилучший способ сделать это?

Пока что я пробовал:

var a : String = "[[0_busswvan, 24.0, 2019-09-05 20:15:33], [05f9acb08d7c11e89e8fede614b72917, 20.0, 2019-09-05 14:06:32], [0_h2qbu9h3, 28.0, 2019-09-05 14:01:20]]" 
var b : String = "[[2_busswvan, 24.0, 2019-09-05 20:15:33],[05f9acb08d7c11e89e8fede614b72917, 25.0, 2019-08-12 14:06:32], [1442qbu9h3, 28.0, 2019-09-05 14:01:20]]" 
a = a.substring(2,a.length-1).concat(",") 
b = b.substring(1,b.length-2) 
var res = a.concat(b) 
var res1 = res.split("\\] ?, ?\\[").map(List(_):List[Any]).toList

Но проблема в его типе: List[List[String]]

Ответы [ 2 ]

1 голос
/ 07 ноября 2019

Единственная маленькая ошибка в том, что вы используете map вместо flatMap

Это работает, как и ожидалось:

 var res1 = res.split("\\] ?, ?\\[").flatMap(List(_):List[Any]).toList

Вот ответ, который объясняет разницу, если вызаинтересованы: https://stackoverflow.com/a/45319928/2750966

Другой способ - flatten все в конце концов:

var res1 = res.split("\\] ?, ?\\[").map(List(_):List[Any]).toList.flatten
0 голосов
/ 08 ноября 2019

В качестве альтернативы решению pme вы можете попробовать использовать модуль комбинаторов синтаксического анализатора .

Во-первых, вам нужно добавить его как зависимость, так как дополнительные функции были перемещены в отдельныемодули:

libraryDependencies += "org.scala-lang.modules" %% "scala-parser-combinators" % "1.1.2"

Тогда вы можете подготовить парсер:

import java.time.format.DateTimeFormatter;
import java.time._
import scala.util.parsing.combinator._

val r = "[[0_busswvan, 24.0, 2019-09-05 20:15:33],[05f9acb08d7c11e89e8fede614b72917, 20.0, 2019-09-05 14:06:32], [0_h2qbu9h3, 28.0, 2019-09-05 14:01:20],[2_busswvan, 24.0, 2019-09-05 20:15:33],[05f9acb08d7c11e89e8fede614b72917, 25.0, 2019-08-12 14:06:32], [1442qbu9h3, 28.0, 2019-09-05 14:01:20]]"

object Parser extends RegexParsers {
  val formatter = DateTimeFormatter.ofPattern("yyyy-MM-dd HH:mm:ss")

  def text: Parser[String] = """\w+""".r //parser for text
  def number: Parser[Double] = """\d+(\.\d*)?""".r ^^ { _.toDouble } //parser for numbers
  def datetime: Parser[LocalDateTime] = """\d{4}-\d{2}-\d{2} \d{2}:\d{2}:\d{2}""".r ^^ { p => LocalDateTime.from(formatter.parse(p)) } //parser for date
  def glue: Parser[String] = """\w*,\w*""".r //parser for comma separators

  def term  : Parser[List[Any]] = "[" ~ text ~ ", " ~ number ~ ", " ~ datetime ~ "]" ~ opt(glue) ^^ { //parser for matching whole sublist
    case _ ~ text ~ _ ~ number ~ _ ~ datetime ~ _ ~ _ =>  {
      List(text, number, datetime)
    }
  }

  def expr  : Parser[List[List[Any]]] = "[" ~> rep(term) <~ "]" //parser for whole list containing arbitrary number of sublist

  def apply(input: String): List[Any] = parseAll(expr, input) match {
    case Success(result, _) => result
    case failure : NoSuccess => scala.sys.error(failure.msg)
  }
}


println(Parser(r))
//List(List(0_busswvan, 24.0, 2019-09-05T20:15:33), List(05f9acb08d7c11e89e8fede614b72917, 20.0, 2019-09-05T14:06:32), List(0_h2qbu9h3, 28.0, 2019-09-05T14:01:20), List(2_busswvan, 24.0, 2019-09-05T20:15:33), List(05f9acb08d7c11e89e8fede614b72917, 25.0, 2019-08-12T14:06:32), List(1442qbu9h3, 28.0, 2019-09-05T14:01:20))

Также существует проблема с вашим подходом, когда вы используете List для хранения значениядля Double, String и LocalDateTime компилятор расширяет тип списка до List[Any]. Вы можете рассмотреть возможность использования кортежа (String, Double, LocalDateTime). В этом случае парсер становится:

import java.time.format.DateTimeFormatter;
import java.time._
import scala.util.parsing.combinator._

val r = "[[0_busswvan, 24.0, 2019-09-05 20:15:33],[05f9acb08d7c11e89e8fede614b72917, 20.0, 2019-09-05 14:06:32], [0_h2qbu9h3, 28.0, 2019-09-05 14:01:20],[2_busswvan, 24.0, 2019-09-05 20:15:33],[05f9acb08d7c11e89e8fede614b72917, 25.0, 2019-08-12 14:06:32], [1442qbu9h3, 28.0, 2019-09-05 14:01:20]]"

object Parser extends RegexParsers {
  val formatter = DateTimeFormatter.ofPattern("yyyy-MM-dd HH:mm:ss")

  def text: Parser[String] = """\w+""".r //parser for text
  def number: Parser[Double] = """\d+(\.\d*)?""".r ^^ { _.toDouble } //parser for numbers
  def datetime: Parser[LocalDateTime] = """\d{4}-\d{2}-\d{2} \d{2}:\d{2}:\d{2}""".r ^^ { p => LocalDateTime.from(formatter.parse(p)) } //parser for date
  def glue: Parser[String] = """\w*,\w*""".r //parser for comma separators

  def term  : Parser[(String, Double, LocalDateTime)] = "[" ~ text ~ ", " ~ number ~ ", " ~ datetime ~ "]" ~ opt(glue) ^^ { //parser for matching whole sublist
    case _ ~ text ~ _ ~ number ~ _ ~ datetime ~ _ ~ _ =>  {
      (text, number, datetime)
    }
  }

  def expr  : Parser[List[(String, Double, LocalDateTime)]] = "[" ~> rep(term) <~ "]" //parser for whole list containing arbitrary number of sublist

  def apply(input: String): List[Any] = parseAll(expr, input) match {
    case Success(result, _) => result
    case failure : NoSuccess => scala.sys.error(failure.msg)
  }
}


println(Parser(r))
//List((0_busswvan,24.0,2019-09-05T20:15:33), (05f9acb08d7c11e89e8fede614b72917,20.0,2019-09-05T14:06:32), (0_h2qbu9h3,28.0,2019-09-05T14:01:20), (2_busswvan,24.0,2019-09-05T20:15:33), (05f9acb08d7c11e89e8fede614b72917,25.0,2019-08-12T14:06:32), (1442qbu9h3,28.0,2019-09-05T14:01:20))
...