Question

Я хотел бы написать метод, который преобразует CamelCase в удобочитаемое имя.

Вот контрольный пример:

public void testSplitCamelCase() {
    assertEquals("lowercase", splitCamelCase("lowercase"));
    assertEquals("Class", splitCamelCase("Class"));
    assertEquals("My Class", splitCamelCase("MyClass"));
    assertEquals("HTML", splitCamelCase("HTML"));
    assertEquals("PDF Loader", splitCamelCase("PDFLoader"));
    assertEquals("A String", splitCamelCase("AString"));
    assertEquals("Simple XML Parser", splitCamelCase("SimpleXMLParser"));
    assertEquals("GL 11 Version", splitCamelCase("GL11Version"));
}

polygenelubricants · Answer 1 · 01 апреля 2010

Это работает с вашими тестами:

static String splitCamelCase(String s) {
   return s.replaceAll(
      String.format("%s|%s|%s",
         "(?<=[A-Z])(?=[A-Z][a-z])",
         "(?<=[^A-Z])(?=[A-Z])",
         "(?<=[A-Za-z])(?=[^A-Za-z])"
      ),
      " "
   );
}

Вот тестовый комплект:

    String[] tests = {
        "lowercase",        // [lowercase]
        "Class",            // [Class]
        "MyClass",          // [My Class]
        "HTML",             // [HTML]
        "PDFLoader",        // [PDF Loader]
        "AString",          // [A String]
        "SimpleXMLParser",  // [Simple XML Parser]
        "GL11Version",      // [GL 11 Version]
        "99Bottles",        // [99 Bottles]
        "May5",             // [May 5]
        "BFG9000",          // [BFG 9000]
    };
    for (String test : tests) {
        System.out.println("[" + splitCamelCase(test) + "]");
    }

Он использует регулярное выражение сопоставления нулевой длины с lookbehind и lookforward, чтобы найти место для вставки пробелов. В основном есть 3 образца, и я использую String.format, чтобы соединить их, чтобы сделать его более читабельным.

Три модели:

UC позади меня, UC и LC передо мной

  XMLParser   AString    PDFLoader
    /\        /\           /\

не-UC позади меня, UC передо мной

 MyClass   99Bottles
  /\        /\

Письмо позади меня, не письмо передо мной

 GL11    May5    BFG9000
  /\       /\      /\

Ссылки

regular-expressions.info / Lookarounds

Похожие вопросы

Использование сопоставления нулевой длины для разделения:

Ralph · Answer 2 · 19 сентября 2013

Вы можете сделать это, используя org.apache.commons.lang.StringUtils

StringUtils.join(
     StringUtils.splitByCharacterTypeCamelCase("ExampleTest"),
     ' '
);

Sahil Chhabra · Answer 3 · 26 октября 2017

Аккуратное и более короткое решение:

StringUtils.capitalize(StringUtils.join(StringUtils.splitByCharacterTypeCamelCase("yourCamelCaseText"), StringUtils.SPACE)); // Your Camel Case Text

jlb83 · Answer 4 · 12 января 2012

Если вам не нравятся «сложные» регулярные выражения и вас не беспокоит эффективность, то я использовал этот пример для достижения того же эффекта в три этапа.

String name = 
    camelName.replaceAll("([A-Z][a-z]+)", " $1") // Words beginning with UC
             .replaceAll("([A-Z][A-Z]+)", " $1") // "Words" of only UC
             .replaceAll("([^A-Za-z ]+)", " $1") // "Words" of non-letters
             .trim();

Проходит все тестовые примеры, перечисленные выше, в том числе с цифрами.

Как я уже сказал, это не так хорошо, как использовать одно регулярное выражение в некоторых других примерах здесь - но кто-то может найти его полезным.

Hendy Irawan · Answer 5 · 18 декабря 2010

Вы можете использовать org.modeshape.common.text.Inflector .

В частности:

String humanize(String lowerCaseAndUnderscoredWords,
    String... removableTokens) 
Прописывает первое слово до заглавных букв и превращает подчеркивания в пробелы и полосы, заканчивающиеся "_id" и любыми поставляемыми съемными токенами.

артефакт Maven: org.modeshape: общий режим формы: 2.3.0.Final

в репозитории JBoss: https://repository.jboss.org/nexus/content/repositories/releases

Вот файл JAR: https://repository.jboss.org/nexus/content/repositories/releases/org/modeshape/modeshape-common/2.3.0.Final/modeshape-common-2.3.0.Final.jar

Xinbi · Answer 6 · 13 июня 2014

Это работает в .NET ... оптимизировать по своему вкусу.Я добавил комментарии, чтобы вы могли понять, что делает каждый кусок.(RegEx может быть трудно понять)

public static string SplitCamelCase(string str)
{
    str = Regex.Replace(str, @"([A-Z])([A-Z][a-z])", "$1 $2");  // Capital followed by capital AND a lowercase.
    str = Regex.Replace(str, @"([a-z])([A-Z])", "$1 $2"); // Lowercase followed by a capital.
    str = Regex.Replace(str, @"(\D)(\d)", "$1 $2"); //Letter followed by a number.
    str = Regex.Replace(str, @"(\d)(\D)", "$1 $2"); // Number followed by letter.
    return str;
}

Felix · Answer 7 · 01 апреля 2010

Я думаю, вам придется перебирать строку и обнаруживать изменения от строчных к прописным, от прописных до строчных, от буквенных к числовым, от цифровых к буквенным. При каждом обнаруженном вами изменении вставьте пробел с одним исключением: при переходе с прописных букв на строчные вставьте пробел на один символ раньше.

Jens · Answer 8 · 01 апреля 2010

Следующее регулярное выражение может использоваться для определения заглавных букв внутри слов:

"((?<=[a-z0-9])[A-Z]|(?<=[a-zA-Z])[0-9]]|(?<=[A-Z])[A-Z](?=[a-z]))"

Соответствует каждой заглавной букве, то есть эфиру после не заглавной буквы или цифры или после строчной буквы и каждой цифры после буквы.

Как вставить пробел до того, как они выходят за рамки моих навыков Java =)

Отредактировано, чтобы включить регистр цифр и регистр PDF Loader.

vbullinger · Answer 9 · 16 августа 2012

Я взял Regex из полигенных смазок и превратил его в метод расширения для объектов:

    /// <summary>
    /// Turns a given object into a sentence by:
    /// Converting the given object into a <see cref="string"/>.
    /// Adding spaces before each capital letter except for the first letter of the string representation of the given object.
    /// Makes the entire string lower case except for the first word and any acronyms.
    /// </summary>
    /// <param name="original">The object to turn into a proper sentence.</param>
    /// <returns>A string representation of the original object that reads like a real sentence.</returns>
    public static string ToProperSentence(this object original)
    {
        Regex addSpacesAtCapitalLettersRegEx = new Regex(@"(?<=[A-Z])(?=[A-Z][a-z]) | (?<=[^A-Z])(?=[A-Z]) | (?<=[A-Za-z])(?=[^A-Za-z])", RegexOptions.IgnorePatternWhitespace);
        string[] words = addSpacesAtCapitalLettersRegEx.Split(original.ToString());
        if (words.Length > 1)
        {
            List<string> wordsList = new List<string> { words[0] };
            wordsList.AddRange(words.Skip(1).Select(word => word.Equals(word.ToUpper()) ? word : word.ToLower()));
            words = wordsList.ToArray();
        }
        return string.Join(" ", words);
    }

Это превращает все в читаемое предложение. Это делает ToString на переданном объекте. Затем он использует Regex, заданный polygenelubricants, чтобы разделить строку. Тогда это ToLowers каждое слово за исключением первого слова и любых сокращений. Я подумал, что это может быть полезно для кого-то там.

gerferra · Answer 10 · 03 июля 2011

Для справки, вот почти (*) совместимая версия Scala:

  object Str { def unapplySeq(s: String): Option[Seq[Char]] = Some(s) }

  def splitCamelCase(str: String) =
    String.valueOf(
      (str + "A" * 2) sliding (3) flatMap {
        case Str(a, b, c) =>
          (a.isUpper, b.isUpper, c.isUpper) match {
            case (true, false, _) => " " + a
            case (false, true, true) => a + " "
            case _ => String.valueOf(a)
          }
      } toArray
    ).trim

После компиляции его можно использовать непосредственно из Java, если соответствующий scala-library.jar находится в пути к классам.

(*) происходит сбой для входа "GL11Version", для которого он возвращает "G L11 Version".

Как мне преобразовать CamelCase в понятные человеку имена в Java?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 12 ]

UC позади меня, UC и LC передо мной

не-UC позади меня, UC передо мной

Письмо позади меня, не письмо передо мной

Ссылки

Похожие вопросы

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как мне преобразовать CamelCase в понятные человеку имена в Java?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 12 ]

UC позади меня, UC и LC передо мной

не-UC позади меня, UC передо мной

Письмо позади меня, не письмо передо мной

Ссылки

Похожие вопросы

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы