Когда речь идет о производительности и распределении ресурсов, вы должны запускать тесты.
Сначала давайте изменим ваши функции, чтобы они не печатали, а возвращали результат:
func getLastRune(s string, c int) string {
j := len(s)
for i := 0; i < c && j > 0; i++ {
_, size := utf8.DecodeLastRuneInString(s[:j])
j -= size
}
return s[j:]
}
func getLastRune2(s string, c int) string {
r := []rune(s)
if c > len(r) {
c = len(r)
}
return string(r[len(r)-c:])
}
И функции бенчмарка:
var s = "hogemogehogemogehogemoge世界世界世界a"
func BenchmarkGetLastRune(b *testing.B) {
for i := 0; i < b.N; i++ {
getLastRune(s, 3)
}
}
func BenchmarkGetLastRune2(b *testing.B) {
for i := 0; i < b.N; i++ {
getLastRune2(s, 3)
}
}
Запуск их:
go test -bench . -benchmem
Результаты:
BenchmarkGetLastRune-4 30000000 36.9 ns/op 0 B/op 0 allocs/op
BenchmarkGetLastRune2-4 10000000 165 ns/op 0 B/op 0 allocs/op
getLastRune()
более чем в 4 раза быстрее .Ни один из них не выполняет никаких выделений, но это происходит из-за оптимизации компилятора (преобразование string
в []rune
и обратно обычно требует выделения).
Если мы запускаем тесты с отключенной оптимизацией:
go test -gcflags '-N -l' -bench . -benchmem
Результаты:
BenchmarkGetLastRune-4 30000000 46.2 ns/op 0 B/op 0 allocs/op
BenchmarkGetLastRune2-4 10000000 197 ns/op 16 B/op 1 allocs/op
Оптимизация компилятора или нет, getLastRune()
- явный победитель.