Сплит строка с |разделитель в Java - PullRequest
31 голосов
/ 10 июня 2011

У меня есть строка, которая выглядит следующим образом: 1|"value"|;

Я хочу разбить эту строку и выбрал | в качестве разделителя.

Мой код выглядит следующим образом:

String[] separated = line.split("|");

Я получаю массив, содержащий все символы как одну запись:

separated[0] = ""
separated[1] = "1"
separated[2] = "|"
separated[3] = """
separated[4] = "v"
separated[5] = "a"
...

Кто-нибудь знает почему?
Не могу ли я разделить строку с помощью |?

Ответы [ 11 ]

73 голосов
/ 10 июня 2011

| рассматривается как OR в RegEx.Так что вам нужно избежать этого:

String[] separated = line.split("\\|");
10 голосов
/ 10 июня 2011

Вы должны избежать |, потому что оно имеет особое значение в регулярном выражении. Взгляните на метод split(..).

String[] sep = line.split("\\|");

Второй \ используется для выхода из |, а первый \ используется для выхода из второго \:).

4 голосов
/ 10 июня 2011

Параметр метода split является регулярным выражением, так как вы можете прочитать здесь .Поскольку | имеет особое значение в регулярных выражениях, вам необходимо его избежать.Код выглядит следующим образом (как уже показали другие):

String[] separated = line.split("\\|");
3 голосов
/ 10 июня 2011

Так не получится, потому что вам нужно сбежать из Трубы | первый. Следующий пример кода, найденный в (http://www.rgagnon.com/javadetails/java-0438.html), показывает пример.

public class StringSplit {
  public static void main(String args[]) throws Exception{
    String testString = "Real|How|To";
    // bad
    System.out.println(java.util.Arrays.toString(
        testString.split("|")
    ));
    // output : [, R, e, a, l, |, H, o, w, |, T, o]

    // good
    System.out.println(java.util.Arrays.toString(
      testString.split("\\|")
    ));
    // output : [Real, How, To]
  }
}
3 голосов
/ 10 июня 2011

Побег из трубы. Это работает.

String.split("\\|");

Трубка - это специальный символ в регулярном выражении, означающий ИЛИ

3 голосов
/ 10 июня 2011

Попробуйте это: String[] separated = line.split("\\|");

Мой ответ лучше. Я исправил орфографию "разделенный"

Кроме того, причина, по которой это работает? | означает «ИЛИ» в регулярном выражении. Вам нужно избежать этого.

2 голосов
/ 27 января 2013

перед разделением вы можете заменить канал другим символом, таким как '#', попробуйте это

String[] seperated = line.replace('|','#').split("#");
2 голосов
/ 10 июня 2011

String.split () использует регулярное выражение, поэтому вам нужно экранировать '|'как .split ("\\ |");

0 голосов
/ 14 июня 2018
Pattern.compile("|").splitAsStream(String you want to split).collect(Collectors.toList());
0 голосов
/ 09 июля 2012
public class StringUtil {

  private static final String HT = "\t";
  private static final String CRLF = "\r\n";

  // This class cannot be instantiated
  private StringUtil() {
  }

  /**
   * Split the string into an array of strings using one of the separator in
   * 'sep'.
   * 
   * @param s
   *            the string to tokenize
   * @param sep
   *            a list of separator to use
   * 
   * @return the array of tokens (an array of size 1 with the original string
   *         if no separator found)
   */
  public static String[] split(final String s, final String sep) {
    // convert a String s to an Array, the elements
    // are delimited by sep
    final Vector<Integer> tokenIndex = new Vector<Integer>(10);
    final int len = s.length();
    int i;

    // Find all characters in string matching one of the separators in 'sep'
    for (i = 0; i < len; i++)
      if (sep.indexOf(s.charAt(i)) != -1)
        tokenIndex.addElement(new Integer(i));

    final int size = tokenIndex.size();
    final String[] elements = new String[size + 1];

    // No separators: return the string as the first element
    if (size == 0)
      elements[0] = s;
    else {
      // Init indexes
      int start = 0;
      int end = (tokenIndex.elementAt(0)).intValue();
      // Get the first token
      elements[0] = s.substring(start, end);

      // Get the mid tokens
      for (i = 1; i < size; i++) {
        // update indexes
        start = (tokenIndex.elementAt(i - 1)).intValue() + 1;
        end = (tokenIndex.elementAt(i)).intValue();
        elements[i] = s.substring(start, end);
      }
      // Get last token
      start = (tokenIndex.elementAt(i - 1)).intValue() + 1;
      elements[i] = (start < s.length()) ? s.substring(start) : "";
    }

    return elements;
  }

}
...