Чтение статьи и токенизация - PullRequest
0 голосов
/ 08 октября 2018

Цель состоит в том, чтобы прочитать файл, затем токенизировать каждое слово в статье и сохранить его в элементе.Позже я могу превратить это в массив другого класса и удалить из него некоторые слова.Проблема заключается в том, что я не знаю, правильно ли он читает и маркирует статью.также я не уверен, должен ли я использовать строку для хранения токенизированной статьи после ее чтения и токенизации.

public class Articles{

    private String article;

    public Articles() {

        article = "";
    }

    public String  getArticle(){

        return article;
    }

    public void readArticle( String file) throws Exception{

        BufferedReader br = new BufferedReader(new FileReader(file));
        String words;
        while((words = br.readLine()) != null) {
            article = words;
            getArticle();
        }

        }
    public void tokenize() {
        StringTokenizer strt = new StringTokenizer(article);
        while (strt.hasMoreTokens()) {
                article = strt.nextToken();
                getArticle();
            }
    }


    public void print() {

        System.out.println(article);
    }
}

1 Ответ

0 голосов
/ 09 октября 2018

Вот пример того, что вы могли бы сделать

import java.util.ArrayList;
import java.util.List;

public class Articles{

private String article;
private ArrayList<String> tokens;

public Articles() {
    article = "";
    tokens = new ArrayList<String>();
}

public String  getArticle(){

    return article;
}

public ArrayList getTokens(){

    return tokens;
}

public void readArticle( String file) throws Exception{
    BufferedReader br = new BufferedReader(new FileReader(file));
    String words;
    while((words = br.readLine()) != null) {
        article = words;
        tokenize();
    }

    }
public void tokenize() {
    StringTokenizer strt = new StringTokenizer(article);
    while (strt.hasMoreTokens()) {
            tokens.add(strt.nextToken());
        }
}


public void print() {

    System.out.println(article);
}
}
...