Разделить абзац на список строк, каждая из которых не превышает заданный размер и избегает разбиения слов пополам - PullRequest
0 голосов
/ 22 ноября 2018

Вопрос

Как можно сделать идиоматическим образом следующее: разбить большое String на список String с, каждый из которых не превышает заданный размер, и избегая разбиения слов пополам.

Ближайшее решение с String.chunked() (Разделение слов)

Наиболее близким решением этого является использование класса Stringchunked() метод.Однако проблема в том, что он разделяет слова в данном String.

Пример использования кода String.chunked()

val longString = "Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eiusmod " +
    "tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, " +
    "quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo " +
    "consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse " +
    "cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non " +
    "proident, sunt in culpa qui officia deserunt mollit anim id est laborum. "

// Split [longString] into list
var listOfStrings = longString.chunked(40)
listOfStrings.forEach {
    println(it)
}

Пример выходных данных ближайшего примера с String.chunked()

Ниже приведен результат, полученный при выполнении предоставленного примера кода.Как видно, слова разбиваются в конце строк.

Lorem ipsum dolor sit amet, consectetur
adipisicing elit, sed do eiusmod tempor
incididunt ut labore et dolore magna ali
qua. Ut enim ad minim veniam, quis nostr
ud exercitation ullamco laboris nisi ut
aliquip ex ea commodo consequat. Duis au
te irure dolor in reprehenderit in volup
tate velit esse cillum dolore eu fugiat
nulla pariatur. Excepteur sint occaecat
cupidatat non proident, sunt in culpa qu
i officia deserunt mollit anim id est la
borum.

Ответы [ 2 ]

0 голосов
/ 22 ноября 2018

Не совсем идиоматический способ, который я нашел, но, возможно, он удовлетворяет вашим потребностям:

fun String.chunkedWords(limitChars: Int,
                        delimiter: Char = ' ',
                        joinCharacter: Char = '\n') =
    splitToSequence(delimiter)
        .reduce { cumulatedString, word ->
          val exceedsSize = cumulatedString.length - cumulatedString.indexOfLast { it == joinCharacter } + "$delimiter$word".length > limitChars
          cumulatedString + if (exceedsSize) {
            joinCharacter
          } else {
            delimiter
          } + word
        }

Затем вы можете использовать его следующим образом:

longText.chunkedWords(40).run(::println)

, что для данной строкизатем напечатает:

Lorem ipsum dolor sit amet, consectetur
adipisicing elit, sed do eiusmod tempor
incididunt ut labore et dolore magna
aliqua. Ut enim ad minim veniam, quis
nostrud exercitation ullamco laboris
nisi ut aliquip ex ea commodo consequat.
Duis aute irure dolor in reprehenderit
in voluptate velit esse cillum dolore eu
fugiat nulla pariatur. Excepteur sint
occaecat cupidatat non proident, sunt in
culpa qui officia deserunt mollit anim
id est laborum.

Вы также можете разбить его на строки оттуда, например, longText.chunkedWords(40).splitAsSequence("\n").Обратите внимание, что он также хорошо разделяется, если в строке уже есть символы новой строки, т. Е. Если у вас есть String как "Testing shorter lines.\nAnd now there comes a very long line", вызов .chunkedWords(17) даст следующий вывод:

Testing shorter
lines.
And now there   // this tries to use the whole 17 characters again
comes a very
long line
0 голосов
/ 22 ноября 2018

Вы можете использовать эту простую вспомогательную функцию:

fun splitIntoChunks(max: Int, string: String): List<String> = ArrayList<String>(string.length / max + 1).also {
    var firstWord = true
    val builder = StringBuilder()

    // split string by whitespace
    for (word in string.split(Regex("( |\n|\r|\n\r)+"))) {
        // if the current string exceeds the max size
        if (builder.length + word.length > max) {
            // then we add the string to the list and clear the builder
            it.add(builder.toString())
            builder.setLength(0)
            firstWord = true
        }
        // append a space at the beginning of each word, except the first one
        if (firstWord) firstWord = false else builder.append(' ')
        builder.append(word)
    }

    // add the last collected part if there was any
    if(builder.isNotEmpty()){
        it.add(builder.toString())
    }
}

, которая затем может быть вызвана просто так:

val chunks: List<String> = splitIntoChunks(20, longString)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...