Ваш вопрос указывает на то, что вы хотели бы иметь какой-то интерактивный режим с вашими данными, но эти данные имеют большой объем.
RADOOP представляет собой комбинацию R и Hadoop, и он должен быть в состоянии предоставить вам графический интерфейс для выполнения ваших больших данных с помощью статистического анализа R с использованием обработки в масштабе Hadoop.
В то же время я предлагаю вам взглянуть на Google-Refine (http://code.google.com/p/google-refine/),, который вы можете легко загрузить и запустить процесс Data Evidence с ним.
С помощью Google-Refine вы можете легко анализировать ваши данные, используя встроенный текст, дату и числовые функции. Вы также можете использовать Jython для дальнейшего расширения необходимой функциональности. Он может обрабатывать данные в больших масштабах и исследовать его особенности с помощью встроенных граней.
R также является отличным инструментом для сбора данных, с хорошей выборкой и другими библиотеками статистического анализа. Но его интерфейс основан на командной строке и предназначен для продвинутых статистиков и аналитиков, а не для обычного пользователя.