Вы когда-нибудь рассматривали Python? Существует множество зрелых библиотек, которые можно использовать для статистического анализа, сбора данных и очистки. Чтобы назвать несколько:
Numpy - N-dim array objects
Scipy - library of statistical and optimisation tools
statsmodels - statistical modeling
Pandas - data structures for time series, cross-sectional, or any other form of “labeled” data
matplotlib - MATLAB-like plotting tools
PyTables - hierarchical database package designed to efficiently manage very large amounts of data
CVXOPT - convex optimization routines
Я лично реализовал некоторые довольно сложные производные модели pring в python, в том числе решетку процентных ставок Vasicek с скачком-диффузией, многие случайные процессы и даже сумел написать генетический оптимизатор.
Один из моих профессоров - директор по исследованиям в области математики в хедж-фонде Чикаго, который использует исключительно Python.