Question

Итак, на прошлой неделе у меня было это задание, и одна из вещей, которые я должен сделать в этом задании, - это чтение отформатированных данных из текстового файла.Под форматированием я имею в виду что-то вроде этого:

{
    Marsha      1234     Florida   1268
    Jane        1523     Texas     4456
    Mark        7253     Georgia   1234
}

(Примечание: это всего лишь пример. Не фактические данные из моего задания.)

Теперь я пытался выяснить этосамостоятельно.Я попытался прочитать каждую строку как строку и использовать .substring(), чтобы получить определенные части указанной строки и поместить ее в массив, а затем извлечь индекс этой строки из массива и распечатать его на экране.Сейчас я попробовал несколько разных вариантов этой идеи, и она просто не работает.Он либо заканчивается ошибкой, либо выводит данные странным образом.Теперь назначение назначено завтра, и я понятия не имею, что делать.Если бы кто-нибудь мог оказать мне какую-то помощь по этому вопросу, это было бы очень признательно.

dbl · Answer 1 · 11 октября 2018

Я действительно верю, что совет @JoniVR будет очень полезен, и вам следует подумать об использовании разделителя для столбцов в строке.В настоящее время вы не сможете анализировать составные данные, например, по имени «Мэри Энн».Кроме того, поскольку у предоставленных вами примеров данных уже есть 4 строки, у вас должен быть POJO, который будет представлять данные, проанализированные из файла.Концептуальная выглядит так:

class MyPojo {

    private String name;
    private int postCode;
    private String state;
    private int cityId;

    public MyPojo(String name, int postCode, String state, int cityId) {
        this.name = name;
        this.postCode = postCode;
        this.state = state;
        this.cityId = cityId;
    }

    public String getName() {
        return name;
    }

    public void setName(String name) {
        this.name = name;
    }

    public int getPostCode() {
        return postCode;
    }

    public void setPostCode(int postCode) {
        this.postCode = postCode;
    }

    public String getState() {
        return state;
    }

    public void setState(String state) {
        this.state = state;
    }

    public int getCityId() {
        return cityId;
    }

    public void setCityId(int cityId) {
        this.cityId = cityId;
    }

    @Override
    public String toString() {
        return "MyPojo{" +
            "name='" + name + '\'' +
            ", postCode=" + postCode +
            ", state='" + state + '\'' +
            ", cityId=" + cityId +
            '}';
    }
}

Тогда вы хотели бы, чтобы ошибки встречались после проверки строк, я думаю, так что было бы неплохо подумать о каком-то классе ошибок, хранящем эти (A должным образомразработан тот, который расширяет класс исключений может быть?).Очень простой класс для этой цели:

class InsertionError {
    private String message;
    private int lineNumber;

    public InsertionError(String message, int lineNumber) {
        this.message = message;
        this.lineNumber = lineNumber;
    }

    @Override
    public String toString() {
        return "Error at line " + lineNumber + " -> " + message;
    }
}

И тогда само решение должно:1. Разделить линии.2. Токенизируйте столбцы для каждой строки и анализируйте / проверяйте их.3. Соберите данные столбцов в полезное представление Java.

Может быть что-то вроде:

private static final int HEADERS_COUNT = 4;
private static final int LINE_NUMBER_CURSOR = 0;

public static void main(String[] args) {
    String data =   "Marsha      1234     Florida   1268\n" +
                    "Jasmine     Texas    4456\n" +
                    "Jane        1523     Texas     4456\n" +
                    "Jasmine     Texas    2233      asd\n" +
                    "Mark        7253     Georgia   1234";

    int[] lineNumber = new int[1];

    List<InsertionError> errors = new ArrayList<>();

    List<MyPojo> insertedPojo = Arrays.stream(data.split("\n"))
        .map(x -> x.split("\\p{Blank}+"))
        .map(x -> {
            lineNumber[LINE_NUMBER_CURSOR]++;

            if (x.length == HEADERS_COUNT) {
                Integer postCode = null;
                Integer cityId = null;

                try {
                    postCode = Integer.valueOf(x[1]);
                } catch (NumberFormatException ignored) {
                    errors.add(new InsertionError("\"" + x[1] + "\" is not a numeric value.", lineNumber[LINE_NUMBER_CURSOR]));
                }

                try {
                    cityId = Integer.valueOf(x[3]);
                } catch (NumberFormatException ignored) {
                    errors.add(new InsertionError("\"" + x[3] + "\" is not a numeric value.", lineNumber[LINE_NUMBER_CURSOR]));
                }

                if (postCode != null && cityId != null) {
                    return new MyPojo(x[0], postCode, x[2], cityId);
                }
            } else {
                errors.add(new InsertionError("Columns count does not match headers count.", lineNumber[LINE_NUMBER_CURSOR]));
            }
            return null;
        })
        .filter(Objects::nonNull)
        .collect(Collectors.toList());

    errors.forEach(System.out::println);

    System.out.println("Number of successfully inserted Pojos is " + insertedPojo.size() + ". Respectively they are: ");

    insertedPojo.forEach(System.out::println);
}

, которое печатает:

Ошибка в строке 2 ->Количество столбцов не соответствует количеству заголовков.Ошибка в строке 4 -> «Техас» не является числовым значением.Ошибка в строке 4 -> «asd» не является числовым значением.Количество успешно вставленных Pojos - 3. Соответственно они:MyPojo {name = 'Marsha', postCode = 1234, штат = 'Флорида', cityId = 1268}MyPojo {name = 'Jane', postCode = 1523, штат = 'Texas', cityId = 4456}MyPojo {name = 'Mark', postCode = 7253, штат = 'Georgia', cityId = 1234}

Level_Up · Answer 2 · 11 октября 2018

Сначала вы должны знать формат вашего файла.Как ваш пример, если он начинается с {и заканчивается}.Что такое разделитель (и) данных?Например, разделитель может быть точкой с запятой, пробелом и так далее.Зная это, вы можете начать создавать приложение.В вашем примере я напишу что-то вроде этого:

public class MainClass
{

public static void main(String[] args)
{
    String s = "{\r\n"+
               "Marsha      1234     Florida   1268\r\n" + 
               "Jane        1523     Texas     4456\r\n" + 
               "Mark        7253     Georgia   1234\r\n"+
               "}\r\n";

    String[] rows = s.split("\r\n");

    //Here we will keep evertihing without the first and the last row
    List<String> importantRows = new ArrayList<>(rows.length-2);
    //lets assume that we do not need the first and the last row
    for(int i=0; i<rows.length; i++)
    {
        //String r = rows[i];
        //System.out.println(r);

        if(i>0 && i<rows.length)
        {
            importantRows.add(rows[i]);
        }

    }

    List<String> importantWords = new ArrayList<>(rows.length-2);
    //Now lets split every 'word' from row
    for(String rowImportantData : importantRows)
    {
        String[] oneRowData = rowImportantData.split(" ");

        //Here we will have one row like: [Marsha][ ][ ][ ][1234][ ][ ][ ][Florida][ ][ ][1268]
        // We need to remove the whitespace. This happen because there is more        
        //then one whitespace one after another. You can use some regex or another approach 
        // but I will show you this because you can have data that you do not need and you want to remove it.
        for(String data : oneRowData)
        {
            if(!data.trim().isEmpty())
            {
                importantWords.add(data);
            }
            //System.out.println(data);
        }

    }

    //Now we have the words.
    //You must know the rules that apply for this data. Let's assume from your example that you have (Name Number) group
    //If we want to print every group (Name Number) and we have in this state list with [Name][Number][Name][Number]....
    //Then we can print it this way
    for(int i=0; i<importantWords.size()-1; i=i+2)
    {
        System.out.println(importantWords.get(i) + " " + importantWords.get(i+1));
    }

}

}

Это только один пример.Вы можете сделать свое приложение многими разными способами.Важная часть заключается в том, чтобы вы знали, каково ваше первоначальное состояние информации, которую вы хотите обработать, и каков результат, которого вы хотите достичь.

Удачи!

Tiago Luna · Answer 3 · 11 октября 2018

Есть много разных подходов, которые вы можете использовать для чтения этого отформатированного файла.Я бы предложил сначала извлечь соответствующие данные из текста в виде списка строк, а затем разбить строки на поля.Это пример того, как вы можете сделать это, используя предоставленный вами образец данных:

import java.util.Arrays;
import java.util.List;
import java.util.stream.Collectors;

public class CustomTextReader {

    public static void main(String[] args) {
        String text =
                "Marsha      1234     Florida   1268\r\n" + 
                "Jane        1523     Texas     4456\r\n" + 
                "Mark        7253     Georgia   1234";

        //Extract the relevant data from the text as a list of arrays
        //  in which each array is a line, and each element is a field. 
        List<String[]> data = getData(text);
        //Just printing the results
        print(data);
    }

    private static List<String[]> getData(String text) {
        //1. Separate content into lines.
        return Arrays.stream(text.split("\r\n"))
                //2. Separate lines into fields.
                .map(s -> s.split("\\s{2,}"))
                .collect(Collectors.toList());
    }

    private static void print(List<String[]> data) {
        data.forEach(line -> {
            for(String field : line) {
                System.out.print(field + " | ");
            }
            System.out.println();
        });

    }
}

Важно знать, чего ожидать от данных с точки зрения формата.Если вы знаете, что поля не содержат пробелов, вы можете использовать " " или \\s{2,} в качестве шаблона для разбиения строки на шаге 2. Но если вы считаете, что данные могут содержать поля с пробелами (например, «Северная Каролина»)) лучше использовать другое регулярное выражение, например \\s{2,} (это то, что я сделал в приведенном выше примере).Я надеюсь, что помог вам!

Hulk · Answer 4 · 11 октября 2018

В приведенном вами примере разбиение строк с помощью регулярного выражения \s+ сработает:

String s = "Marsha      1234     Florida   1268";
s.split("\\s+");

приведет к массиву, содержащему 4 элемента "Marsha", "1234", "Флорида "и" 1268 ".

Использованный мной шаблон соответствует одному или нескольким пробельным символам - см. JavaDocs Pattern для получения подробной информации и других параметров.

Другой подход состоит в том, чтобы определить шаблон, которому должна соответствовать ваша линия в целом, и охватить группы, которые вас интересуют:

String s = "Marsha      1234     Florida   1268";

Pattern pattern = Pattern.compile("(\\w+)\\s+(\\d+)\\s+(\\w+)\\s+(\\d+)");
Matcher matcher = pattern.matcher(s);

if (!matcher.matches())
    throw new IllegalArgumentException("line does not match the expected pattern"); //or do whatever else is appropriate for your use case

String name = matcher.group(1);
String id = matcher.group(2);
String state = matcher.group(3);
String whatever = matcher.group(4);

Для этого шаблона требуется, чтобы вторая и четвертая группы состояли только из цифр.

Однако обратите внимание, что оба этих подхода потерпят неудачу, если ваши данные также могут содержать пробелы - в этом случае вам потребуются разные шаблоны.

Как читать отформатированные данные из текстового файла в Java

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как читать отформатированные данные из текстового файла в Java

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы