Заменить n-е вхождение на обратное - PullRequest
4 голосов
/ 15 мая 2019

Scala предоставляет готовые методы для работы с первым или со всеми вхождениями шаблона.

Как лучше (или каноническим способом) заменить только n-е вхождение?

Я могу придумать пару решений, но мне не очень нравится ни одно из них.

Первый использует изменяемую переменную для отслеживания вхождений.

  def f1(str: String, pattern: String, occurrence: Int) = {
    pattern.r.replaceAllIn(str, {var c = 0
      m: Match => {
      c = c + 1
      if (c == occurrence) m.group(1).reverse else m.group(1)
      }
    })
  }

  println(f1("aaa bbb123, ccc456, ddd789, qqq1010 206z", """(\d+)""", 3))

Второй находит все совпадения, подбирает необходимые и применяет метод исправления для строки.

  def f2(str: String, pattern: String, occurrence: Int) = {
    val m = pattern.r.findAllMatchIn(str).toList.lift(occurrence-1)
    m match {
      case Some(m) => str.patch(m.start(1), m.group(1).reverse, m.group(1).length)
      case None => str
    }
  }

  println(f2("aaa bbb123, ccc456, ddd789, qqq1010 206z", """(\d+)""", 3))

Есть более краткий / предпочтительный или лучший способ?

Обновление

Еще один подход с zipAll.

  def f5(str: String, pattern: String, occurrence: Int) = {
    val m = pattern.r.findAllIn(str).toArray
    val x = str.split(pattern)
    if (x.size>occurrence) m(occurrence-1) = m(occurrence-1).reverse
    x.zipAll(m, "", "").flatMap(t => List(t._1, t._2)).mkString
  }

Результаты теста производительности для функций f1 ... f5 с 1 000 000 выполнений и ниже для измерения истекшего времени

  def time[R](block: => R): R = {
    val t0 = System.nanoTime()
    val result = block    // call-by-name
    val t1 = System.nanoTime()
    println("Elapsed time: " + (t1 - t0) + "ns")
    result
  }

Elapsed time: 6352446800ns
Elapsed time: 4832129400ns
Elapsed time: 3153650800ns
Elapsed time: 3501623300ns
Elapsed time: 6276521500ns

f3 кажется лучшим (что ожидается).

1 Ответ

4 голосов
/ 15 мая 2019

Я думаю, что ваш второй подход хорош, но я бы не стал беспокоиться о манипуляциях List.

def f3(str: String, pattern: String, occurrence: Int) = {
  val mi = pattern.r.findAllMatchIn(str).drop(occurrence - 1)
  if (mi.hasNext) {
    val m = mi.next()
    val s = m.group(0)
    str.patch(m.start, s.reverse, s.length)
  } else str
}

update : вы также можете попробовать этонебольшая модификация.

def f4(str: String, pattern: String, occurrence: Int) =
  util.Try{pattern.r.findAllMatchIn(str).drop(occurrence - 1).next()
  }.fold(_=>str, m=>str.patch(m.start, m.group(0).reverse, m.group(0).length))


f4("aaa bbb123, ccc456, ddd789, qqq1010 206z", "\\d+", 3)

Это немного более кратко (одна строка) и несколько безопаснее (не выбросит, если pattern не может быть скомпилировано в регулярное выражение), но я не уверенэто на самом деле предпочтительнее.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...