Sweave / R - автоматическая генерация приложения, содержащего все сводки / графики / профили данных моделей из анализа - PullRequest
4 голосов
/ 19 апреля 2010

Мне нравится идея сделать исследование доступным на нескольких уровнях детализации, т. Е. Аннотацией для небрежно любопытного, полным текстом для более заинтересованных, и, наконец, данными и кодом для тех, кто работает в той же области / пытается воспроизвести ваши результаты , Между реальным текстом и уровнем данных / кода я бы хотел вставить еще один слой. А именно, я хотел бы создать своего рода автоматически сгенерированное приложение, которое будет содержать результаты полной регрессии, диагностические графики, профили данных исследовательских графиков и т. Д. Из анализа, независимо от попали ли эти графики / регрессии в окончательный вариант.

У меня была одна идея - написать скрипт, который бы автоматически проверял файл .Rnw:

  • Профилировать все загруженные наборы данных (вроде пакета Hmisc (?))
  • Суммируйте все регрессии - то есть, запустите сводку (модель) для всех моделей
  • Представить все сюжеты (независимо от того, сделали ли они это в финальной версии)

Идея состоит в том, чтобы сделать этот вид вещи, не требующей больших усилий, кнопочной, в отличие от формального приложения, написанного как остальная часть статьи. То, что я ищу, - это некоторые идеи относительно того, как сделать это в R относительно простым способом. Я догадываюсь, что есть какой-то способ прохождения пространства имен, выяснения того, что что-то есть, и затем выгрузка в PDF.

Мысли? Что-то подобное уже существует?

Ответы [ 2 ]

1 голос
/ 07 мая 2010

Мы предприняли попытку сделать это с нашей недавней статьей JASA: http://hdl.handle.net/1902.1/12174. Вы должны быть в состоянии "сделать" всю статью. Обратите внимание на один момент в нашем архиве: мы упаковали версии пакетов R, которые мы использовали. Оказалось, что когда люди улучшают свои пакеты, иногда они меняют настройки по умолчанию, что может нарушить нашу сборку. Возможно, в будущем можно будет распределить всю виртуальную машину, включая двоичный файл R, который будет называться [вспомните, как round (x, digits =) потерял свои аргументы и стал позиционировать от версии R до следующего раунда создания (digits =, х) предоставлять бессмысленные результаты без предупреждения?].

Во всяком случае, это наша первая попытка создать такой сложный документ. У меня есть уменьшенная версия здесь http://hdl.handle.net/1902.1/13376, которая не использует make.

1 голос
/ 19 апреля 2010

Джон, это звучит интересно, но если вы предоставите данные, и статья будет отформатирована в кратком изложении, не будет ли этот длинный файл журнала избыточным?

Возвращаясь к вашему вопросу, вам может потребоваться посмотреть один пакет: zelig , поскольку он "автоматизирует создание файлов данных репликации, чтобы вы (или, если хотите, кто-нибудь еще) может воспроизвести результаты вашего анализа (следовательно, удовлетворяя стандарту репликации) ". Не то, что вы ищете, но концепция файлов данных репликации может дать вам другие идеи. обратите внимание, что несколько журналов теперь используют файлы данных репликации.

...