Как разбить и разобрать текстовый файл в Java - PullRequest
0 голосов
/ 28 мая 2018

Для школьного проекта мне нужно извлечь сообщения из текстового файла.Я создал класс сообщений:

public class Message {

    private String from;

    private String to;

    private String body;

    public Message(String from, String to, String body) {
        this.from = from;
        this.to = to;
        this.body = body;
    }
}

Текстовый файл выглядит следующим образом:

From: sender
To: Address
blah blah blah
blah blah(can be more then one line)
#(represent end of message)
From: sender2
To: Address2
blah blah blah
blah blah(can be more then one line)
#

Мне нужно создать ArrayList сообщений из этого текстового файла, но я не уверенкак разделить это.Просто чтобы уточнить, отправитель, адресат и тело разделяются новой строкой, а сообщения заканчиваются на «#».

Ответы [ 2 ]

0 голосов
/ 28 мая 2018

Вы можете изменить свой Message класс:

class Message {

    private String from = "";
    private String to = "";
    private String body = "";

    public void setFrom(String from) {
        this.from = from;
    }

    public void setTo(String to) {
        this.to = to;
    }

    public void addBody(String body) {
        if (!this.body.isEmpty())
            this.body += '\n';
        this.body += body;
    }
}

И затем просто прочитать все строки из вашего текстового файла, и построчно создать Message экземпляр:

private static List<Message> getMessages(List<String> lines) {
    final String separator = "#";
    final String from = "From:";
    final String to = "To:";

    Message message = null;
    List<Message> messages = new ArrayList<>();

    for (String line : lines) {
        if (line.startsWith(separator))
            message = null;
        else {
            if (message == null)
                messages.add(message = new Message());

            if (line.startsWith(from))
                message.setFrom(line.substring(from.length()).trim());
            else if (line.startsWith(to))
                message.setTo(line.substring(to.length()).trim());
            else
                message.addBody(line);
        }
    }

    return messages;
}

PS Чтобы прочитать текстовый файл в виде списка ines, используйте, например, List<String> lines = Files.readAllLines(Paths.get("data.txt"));

0 голосов
/ 28 мая 2018

Я написал parse(), метод анализа для вашего класса Message.Я также написал простой тест в main(), чтобы продемонстрировать, как разбить текстовый файл на отдельные сообщения.Обратите внимание, что это решение имеет ограничения.Он сохраняет весь текстовый файл в памяти как String.Если размер текстового файла составляет один или несколько ГБ, необходимо найти решение для обработки потока в соответствии с этим вопросом .

import org.apache.commons.lang3.StringUtils;

import java.util.ArrayList;
import java.util.List;

public class Message {

    private String from;
    private String to;
    private String body;

    public Message(String from, String to, String body) {
        this.from = from;
        this.to = to;
        this.body = body;
    }

    public String toString() {
        return "From: " + from + "\n" +
                "To: " + to + "\n" +
                "Body: " + body;
    }

    // creates a messsage object from a string
    public static Message parse(String msg) {
        if (msg == null || StringUtils.countMatches(msg, "\n") <= 2) {
            throw new IllegalArgumentException("Invalid string! Needing a string with at least 3 lines!");
        }
        // first, find from and to with two splits by new line
        String[] splits = msg.split("\n");
        // replace the non-informative 'From: " beginning, should it be there
        String from = splits[0].replace("From: ", "");
        // replace the non-informative 'To: " beginning, should it be there
        String to = splits[1].replace("To: ", "");
        // the rest is body
        String body = msg.substring(msg.indexOf(to) + to.length() + 1, msg.length());
        // remove leading and trailing whitespaces
        body = StringUtils.trim(body);
        return new Message(from, to, body);
    }

    public static void main(String[] args) {
        List<Message> allMessages = new ArrayList<>();
        String text = "From: sender\n" +
                "To: Address\n" +
                "blah blah blah\n" +
                "blah blah(can be more then one line)\n" +
                "#\n" +
                "From: sender2\n" +
                "To: Address2\n" +
                "blah blah blah\n" +
                "blah blah(can be more then one line)";
        // split the text by what separates messages from each other
        String[] split = text.split("#\n");
        for (String msg : split) {
            allMessages.add(Message.parse(msg));
        }
        // print each message to System.out as a simple means of demonstrating the code
        allMessages.forEach(System.out::println);
    }
}
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...