Kotlin Максимальная длина строки? (Kotlin файл с длинной строкой не компилируется) - PullRequest
2 голосов
/ 30 мая 2020

Согласно этот ответ Java может содержать до 2 ^ 31-1 символов. Я пытался провести сравнительный анализ и прочее, поэтому я попытался создать большой объем строки и записать его в такой файл:

import java.io.*

fun main() {
    val out = File("ouput.txt").apply { createNewFile() }.printWriter()
    sequence {
        var x = 0
        while (true) {
            yield("${++x} ${++x} ${++x} ${++x} ${++x}")
        }
    }.take(5000).forEach { out.println(it) }
    out.close()
}

А затем файл output.txt содержит примерно следующее:

1 2 3 4 5
6 7 8 9 10
11 12 13 14 15
16 17 18 19 20
21 22 23 24 25
// ... 5000 lines

И затем я скопировал все содержимое файла в строку для некоторого тестирования некоторых функций, вот как это выглядит:

import kotlin.system.*

fun main() {
    val inputs = """
        1 2 3 4 5
        6 7 8 9 10
        11 12 13 14 15
        16 17 18 19 20
        21 22 23 24 25
        // ... 5000 lines
        24986 24987 24988 24989 24990
        24991 24992 24993 24994 24995
        24996 24997 24998 24999 25000

    """.trimIndent()
    measureNanoTime {
        inputs.reader().forEachLine { line ->
            val (a, b, c, d, e) = line.split(" ").map(String::toInt)
        }
    }.div(5000).let(::println)
}

Общее количество символов файла / строки: 138894

Строка может содержать до 2147483647

Но код Kotlin не компилируется (последний файл) Это вызывает компиляцию ошибка:

e: org.jetbrains.kotlin.codegen.CompilationException: Back-end (JVM) Internal error: wrong bytecode generated
// more lines
The root cause java.lang.IllegalArgumentException was thrown at: org.jetbrains.org.objectweb.asm.ByteVector.putUTF8(ByteVector.java:246)
    at org.jetbrains.kotlin.codegen.TransformationMethodVisitor.visitEnd(TransformationMethodVisitor.kt:92)
    at org.jetbrains.kotlin.codegen.FunctionCodegen.endVisit(FunctionCodegen.java:971)
    ... 43 more
Caused by: java.lang.IllegalArgumentException: UTF8 string too large

Вот общий журнал исключений с трассировкой стека: https://gist.github.com/Animeshz/1a18a7e99b0c0b913027b7fb36940c07

1 Ответ

3 голосов
/ 30 мая 2020

Есть ограничение в java файле класса, длина строковой константы должна соответствовать 16 битам ie. 65535 байтов (не символов) - максимальная длина строки в исходном коде.

Формат файла класса

...