Конвертировать код R в скрипт Python - PullRequest
1 голос
/ 05 августа 2010

Я получил следующий код R, и мне нужно преобразовать его в python и запустить его в среде python, в основном я сделал это с модулем rpy2, но это выглядит скучно, когда python делает то же самое, так что кто-то может найти лучший способ переписать следующий код R в эквивалентный скрипт Python с помощью модуля rpy2?

mymad <- function (x) 
{
    center <- median(x)
    y <- abs(x - center)
    n <- length(y)
    if (n == 0) 
        return(NA)
    half <- (n + 1)/2
    1.4826 * if (n%%2 == 1) {
        sort(y, partial = half)[half]
    }
    else {
        sum(sort(y, partial = c(half, half + 1))[c(half, half + 
            1)])/2
    }
}

Ответы [ 3 ]

7 голосов
/ 05 августа 2010

Вы могли бы указать цель своей функции: Среднее абсолютное отклонение . То, что вы называете mymad, является приблизительным значением стандартного отклонения совокупности на основе предположения о больших выборках нормально распределенных переменных.

Согласно этому сайту :

def median(pool):
    copy = sorted(pool)
    size = len(copy)
    if size % 2 == 1:
        return copy[(size - 1) / 2]
    else:
        return (copy[size/2 - 1] + copy[size/2]) / 2

Итак, вам нужна функция mad, которая будет проверять:

mad(x) == median(abs(x-median(x)))

Спасибо Elenaher (дайте кредиты за комментарии), вот код:

def mad(x):
    return median([abs(val-median(x)) for val in x])

А потом, я полагаю, вы вычислили:

def mymad(x):
    return 1.4826*mad(x)
3 голосов
/ 07 августа 2010

Вероятно, немного медленнее, чем написанная на numpy / Python, но, безусловно, быстрее для реализации (так как никакое колесо не переизобретается):

# requires rpy2 >= 2.1
from rpy2.robjects.packages import importr
stats = importr('stats')

stats.mad(x)
2 голосов
/ 18 марта 2014
import numpy
# x is the input array
x = numpy.array( [1,2,4,3,1,6,7,5,4,6,7], float ) }
# mad = median( | x - median(x) | )
mad =  numpy.median( numpy.abs( ( x - numpy.median( x ) ) )
...