Как удалить дополнительные разрывы строк в строке - PullRequest
0 голосов
/ 09 сентября 2018

У меня есть такой текст в моих строках (который я уже прочитал с txt.file)

 trump;Donald Trump;trump@yahoo.eu    
 obama;Barack Obama;obama@google.com   
 bush;George Bush;bush@inbox.com    
 clinton,Bill Clinton;clinton@mail.com

Тогда я пытаюсь отключить все, кроме адреса электронной почты и распечатать на консоли

String f1[] = null;
f1=s.split("(.*?);");
for (int i=0;i<f1.length;i++) {
       System.out.print(f1[i]);
   }

и у меня есть вывод, как это:

trump@yahoo.eu  
obama@google.com   
bush@inbox.com  
clinton@mail.com

Как мне избежать такого вывода, я имею в виду, как я могу получить выводимый текст без разрывов строки?

Ответы [ 5 ]

0 голосов
/ 09 сентября 2018

Просто замените '\ n', которые могут появиться в начале и в конце. напишите так.

String f1[] = null;
f1=s.split("(.*?);");
for (int i=0;i<f1.length;i++) {
f1[i] = f1[i].replace("\n");
System.out.print(f1[i]);
}
0 голосов
/ 09 сентября 2018

Вместо разделения вы можете сопоставить формат, подобный электронному письму, сопоставляя не точку с запятой или символ пробела один или несколько раз, используя класс отрицательных символов [^\\s;]+, за которым следует символ @ и снова сопоставление не точки с запятой или символа пробела.

final String regex = "[^\\s;]+@[^\\s;]+";
final String string = "trump;Donald Trump;trump@yahoo.eu    \n"
         + " obama;Barack Obama;obama@google.com   \n"
         + " bush;George Bush;bush@inbox.com    \n"
         + " clinton,Bill Clinton;clinton@mail.com";

final Pattern pattern = Pattern.compile(regex, Pattern.MULTILINE);
final Matcher matcher = pattern.matcher(string);
final List<String> matches = new ArrayList<String>();
while (matcher.find()) {
    matches.add(matcher.group());
}
System.out.println(String.join("", matches));

[^\\s;]+@[^\\s;]+

Regex demo

Демонстрация Java

0 голосов
/ 09 сентября 2018

Вы можете просто заменить все прерыватели строки, как показано в приведенном ниже коде:

String f1[] = null;
f1=s.split("(.*?);");
for (int i=0;i<f1.length;i++) {
    System.out.print(f1[i].replaceAll("\r", "").replaceAll("\n", ""));
}

Это заменит все без пробела.

0 голосов
/ 09 сентября 2018
package com.test;

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class Test {

    public static void main(String[] args) {
        String s = "trump;Donald Trump;trump@yahoo.eu    "
                + "obama;Barack Obama;obama@google.com   "
                + "bush;George Bush;bush@inbox.com    "
                + "clinton;Bill Clinton;clinton@mail.com";

        String spaceStrings[] = s.split("[\\s,;]+");
        String output="";
        for(String word:spaceStrings){
            if(validate(word)){
                output+=word;
            }
        }
        System.out.println(output);
    }

    public static final Pattern VALID_EMAIL_ADDRESS_REGEX = Pattern.compile(
            "^[A-Z0-9._%+-]+@[A-Z0-9.-]+\\.[A-Z]{2,6}$",
            Pattern.CASE_INSENSITIVE);

    public static boolean validate(String emailStr) {
        Matcher matcher = VALID_EMAIL_ADDRESS_REGEX.matcher(emailStr);
        return matcher.find();
    }

}
0 голосов
/ 09 сентября 2018

Попробуйте использовать следующий подход. Я прочитал ваш файл с Scanner и BufferedReader, и в обоих случаях я не получаю разрыв строки. file.txt - это файл, содержащий текст, и логика разбиения остается той же, что и у вас

public class CC {
public static void main(String[] args) throws IOException {
    Scanner scan = new Scanner(new File("file.txt"));

    while (scan.hasNext()) {
        String f1[] = null;
        f1 = scan.nextLine().split("(.*?);");
        for (int i = 0; i < f1.length; i++) {
            System.out.print(f1[i]);
        }
    }
    scan.close();

    BufferedReader br = new BufferedReader(new FileReader(new File("file.txt")));
    String str = null;
    while ((str = br.readLine()) != null) {
        String f1[] = null;
        f1 = str.split("(.*?);");
        for (int i = 0; i < f1.length; i++) {
            System.out.print(f1[i]);
        }
    }
    br.close();
}
}
...