Нужно немного указывать в правильном направлении в отношении расчета корреляции Пирсона в Java - PullRequest
1 голос
/ 12 декабря 2010

Я пытаюсь вычислить корреляцию Пирсона между 13 переменными в текстовом файле с разделителями табуляции, где каждый столбец является переменной.Я использую Java и надеялся, что кто-нибудь может дать мне некоторое руководство относительно того, какие библиотеки или какие функции мне следует использовать.Я предполагаю, что сначала мне нужно будет прочитать содержимое файла, но не могу понять, как заставить программу знать, что каждый столбец подобен массиву, который позволил бы мне выполнить необходимые вычисления.Я бы подумал, что пакет java.io будет лучшим местом для начала, но я просто не могу понять, какие классы я мог бы использовать для своей задачи.Я также рассмотрел http://commons.apache.org/math/, в котором есть функция измерения корреляции Пирсона, но это было бы слишком просто, и поскольку это задание Uni, я должен реализовать его с нуля.Глядя на корреляцию Pearsons в Appache, они, похоже, подошли к проблеме, как матрица, где каждый столбец матрицы является переменной.

Извините за длинное описание моей проблемы.Если вы, ребята, знаете какие-либо веб-сайты или какие-либо хорошие ключевые слова для поиска или любую другую информацию, я был бы очень признателен.Спасибо, Арлинд.

1 Ответ

1 голос
/ 12 декабря 2010

Вы можете сделать это, используя только стандартные библиотеки Java Math, String, File I / O, а также несколько массивов и циклов!

Прочтите это сначала, чтобы научиться читать в файле. http://www.roseindia.net/java/beginners/java-read-file-line-by-line.shtml

Внутри цикла проанализируйте ваш CSV-файл, используя метод String.split (String Regex). например strLine.split ( ""). * * 1006

Преобразуйте это в массив значений типа double, используя Double.parseDouble для каждой строки в строке []

Оттуда вы можете использовать Math.sqrt (двойной а) и Math.pow (double a, double b) функционирует вместе с некоторыми простыми циклами для вычисления вашей корреляции для каждой пары переменных.

Надеюсь, этого достаточно, чтобы начать, не стесняйтесь писать, если вам нужна дополнительная помощь!

...