Scala предоставляет готовые методы для работы с первым или со всеми вхождениями шаблона.
Как лучше (или каноническим способом) заменить только n-е вхождение?
Я могу придумать пару решений, но мне не очень нравится ни одно из них.
Первый использует изменяемую переменную для отслеживания вхождений.
def f1(str: String, pattern: String, occurrence: Int) = {
pattern.r.replaceAllIn(str, {var c = 0
m: Match => {
c = c + 1
if (c == occurrence) m.group(1).reverse else m.group(1)
}
})
}
println(f1("aaa bbb123, ccc456, ddd789, qqq1010 206z", """(\d+)""", 3))
Второй находит все совпадения, подбирает необходимые и применяет метод исправления для строки.
def f2(str: String, pattern: String, occurrence: Int) = {
val m = pattern.r.findAllMatchIn(str).toList.lift(occurrence-1)
m match {
case Some(m) => str.patch(m.start(1), m.group(1).reverse, m.group(1).length)
case None => str
}
}
println(f2("aaa bbb123, ccc456, ddd789, qqq1010 206z", """(\d+)""", 3))
Есть более краткий / предпочтительный или лучший способ?
Обновление
Еще один подход с zipAll.
def f5(str: String, pattern: String, occurrence: Int) = {
val m = pattern.r.findAllIn(str).toArray
val x = str.split(pattern)
if (x.size>occurrence) m(occurrence-1) = m(occurrence-1).reverse
x.zipAll(m, "", "").flatMap(t => List(t._1, t._2)).mkString
}
Результаты теста производительности для функций f1 ... f5 с 1 000 000 выполнений и ниже для измерения истекшего времени
def time[R](block: => R): R = {
val t0 = System.nanoTime()
val result = block // call-by-name
val t1 = System.nanoTime()
println("Elapsed time: " + (t1 - t0) + "ns")
result
}
Elapsed time: 6352446800ns
Elapsed time: 4832129400ns
Elapsed time: 3153650800ns
Elapsed time: 3501623300ns
Elapsed time: 6276521500ns
f3 кажется лучшим (что ожидается).