моя программа java tf-idf не читает файл, который должен - PullRequest
0 голосов

программа должна прочитать файл, имя файла которого будет arquivo.txt, и должна прочитать его содержимое и вычислить tf-idf термина, который будет вставлен пользователем, но он говорит, что не может найти arquivo.TXT-файл, даже подумал, что он находится в файле src программы.

import java.io.File;
import java.util.Scanner;
import java.util.List;

public class ReadFile {
    public static String readFile(String filename) {
        StringBuffer sb = new StringBuffer();
        try {
            File file = new File(filename);
            Scanner input = new Scanner(file);
            while (input.hasNextLine()) {
                sb.append(input.nextLine() + "\n");
            }
            input.close();
        } catch (Exception ex) {
            ex.printStackTrace();
        }
        return sb.toString();
    }

    public static void main(String[] args) {
        String conteudo = readFile("arquivo.txt") ;
        System.out.println(conteudo);

        double idf = Math.log(1/1);
        System.out.println("informe o termo");
        Scanner in = new Scanner(System.in);
        String term = in.nextLine();
        System.out.println("informe o documento(arquivo/nome do arquivo)");
        String doc = in.nextLine();

    }



    public class TFIDFCalculator {
        public double tf(List <String> doc, String term) {
            double result = 0;
            for (String word : doc) {
                if (term.equalsIgnoreCase(word))
                    result++;
            }
            return result / doc.size();
        }

        public double idf(List <List <String>> docs, String term) {
            double n = 0;
            for (List <String> doc : docs) {
                for (String word : doc) {
                    if (term.equalsIgnoreCase(word)) {
                        n++;
                        break;
                    }
                }
            }
            return Math.log(docs.size() / n);
        }

        public double tfidf(List <String> doc, List <List <String>> docs, String term) {
            return tf(doc, term) * idf(docs, term);
        }



    }
}

попытался запрограммировать код в другом стиле, в результате он не будет отображать опцию выполнения, например, intellij не найдет выполняемую часть.

import java.io.File;
import java.util.ArrayList;
import java.util.List;
import java.util.Scanner;


public class Main {
    public void main(String[] args) {
        List wordList = new ArrayList();
        String conteudo = readFile("arquivo.txt") ;
        String[] parts = conteudo.split("_");
        int i =0;
        for (String part: parts) {
            wordList.add(parts[i]);i++;
        }
        System.out.println(conteudo);

        double idf = Math.log(1/1);
        System.out.println("informe o termo");
        Scanner in = new Scanner(System.in);
        String term = in.nextLine();
        System.out.println("informe o documento(arquivo/nome do arquivo)");
        String doc = in.nextLine();
        double actualTfidf = tfidf(wordList,wordList, "work");
        System.out.println("the tfidf is "+ actualTfidf);

    }
    //methods
    private double tfidf(List <String> doc, List <List <String>> docs, String term) {
        return tf(doc, term) * idf(docs, term);
    }

    public static String readFile(String filename) {
        StringBuffer sb = new StringBuffer();
        try {
            File file = new File(filename);
            Scanner input = new Scanner(file);
            while (input.hasNextLine()) {
                sb.append(input.nextLine() + "\n");
            }
            input.close();
        } catch (Exception ex) {
            ex.printStackTrace();
        }
        return sb.toString();
    }

    public double idf(List <List <String>> docs, String term) {
        double n = 0;
        for (List <String> doc : docs) {
            for (String word : doc) {
                if (term.equalsIgnoreCase(word)) {
                    n++;
                    break;
                }
            }
        }
        return Math.log(docs.size() / n);
    }

    public double tf(List <String> doc, String term) {
        double result = 0;
        for (String word : doc) {
            if (term.equalsIgnoreCase(word))
                result++;
        }
        return result / doc.size();
    }

}

    enter code here
...