сбор данных для статистики: из сети в базу данных - PullRequest
16 голосов
/ 02 октября 2010

Я статистика по профессии, и мне хотелось бы дать несколько рекомендаций о том, как настроить веб-сайт, который может собирать данные в базу данных.Для личного пользования я использую Google Forms для сбора данных, и все это заносится в электронную таблицу.Однако это может не подходить для более профессиональных условий, особенно когда у нас несколько страниц / форм.Я представляю два варианта использования:

  1. Веб-сайт, на котором я могу отправить ссылку другим пользователям, чтобы они могли заполнить, аналогично Google Forms.
  2. Веб-сайт, на котором могут авторизоваться только авторизованные пользователи.заполнить данные.Подумайте о ситуации, когда за пациентами периодически следят в научном исследовании.Было бы здорово, если бы врач вводил данные непосредственно в базу данных, когда он / она заполняет формы, а не заставляет другого аналитика данных записывать свои письменные формы в базу данных.

ОчевидноеРешение было бы нанять веб-разработчика.Тем не менее, мне нравится делать вещи самостоятельно, когда они управляемы.Я полагаю, что веб-разработчик должен знать HTML, PHP и базы данных (например, MySQL или PostgreSQL).Мой опыт в этом ограничен настройкой WordPress блога на моем сервере Linux.Мой опыт работы с html также ограничен, так как я использую emacs org-mode для генерации их из простого текста.Я надеюсь услышать о решениях с минимальной кривой обучения.Конечно, я бы предпочел бесплатное программное обеспечение с открытым исходным кодом и на базе Linux, но я бы хотел услышать все доступные решения (наш менеджер данных - пользователь Windows).

Недавно я прочитал сообщение в Linux Journal, в котором упоминается REDCap , но, похоже, вам необходимо получить институциональное разрешение на использование.

Я также пометил «R» в этом посте, поскольку хотел бы услышать, чтоR пользователи делают о сборе данных.В конечном итоге я проанализирую данные с помощью R, но весь анализ данных начинается с научного вопроса и сбора данных.

Спасибо!

ОБНОВЛЕНИЕ 04.10.2010: Спасибо всем за ответыдалеко.Похоже, что большинство сторонних решений, предложенных до сих пор, содержат данные, размещенные в базе данных, размещенной поставщиком.Я хотел бы разместить все данные в нашем SQL Server.То есть ввод данных из Интернета поступает в базу данных в режиме реального времени, готовый для анализа данных.

Ответы [ 4 ]

7 голосов
/ 02 октября 2010

Возможно, проект limesurvey.org представляет интерес ...

4 голосов
/ 04 октября 2010

Я провел медицинское исследование, используя онлайн-форму (фактически два из них). Мои вопросы были довольно дискретными и касались болезни, которую я исследовал.

Ранее в связанном проекте я создал две или три страницы анкеты, которые были напечатаны, а затем испытуемые и хирурги заполняли формы, и наш координатор исследований вводил их в нашу базу данных. Это была большая работа с большим количеством места для ошибки. Мне это не понравилось. Онлайн формы были намного лучше.

Я использовал SurveyGizmo и был доволен этим. Я посмотрел много вариантов около двух лет назад. Формы Google не существовали в то время. Я пошел с SurveryGizmo прежде всего потому, что у них было заявление (аттестация), что они соответствуют HIPAA. Я не мог обеспечить безопасность, такую ​​как ssl-соединения с другими сайтами. Однако, чтобы получить такую ​​возможность (соединения https), мне пришлось купить корпоративный уровень, хотя на каждую другую возможность, которую я мог бы использовать, бесплатный сервис. Также SurveyGizmo предлагает 50% скидку для некоммерческих организаций, на которые наш исследовательский институт имеет право.

SurveryGizmo легко проектировать и запускать в производство без необходимости программировать себя. Было легко загрузить данные в формате csv и прочитать их прямо в R. Хотя у меня были некоторые странные проблемы, с которыми мне требовалась помощь. Мне пришлось использовать «старый» формат для экспорта, чтобы он представлял собой прямолинейный CSV. Кроме того, CSV-файл имел странную особенность первых двух строк, являющихся строками заголовка. Но я решил эту проблему с помощью stackoverflow .

SurveryGizmo обладает фантастической логикой и трубами, которые позволили мне задавать только соответствующие вопросы и, таким образом, не тратить время моих респондентов и, что еще более важно, не было никаких неуместных вопросов, чтобы сбить с толку респондентов.

Наконец, я смог использовать SurveyGizmo таким образом, чтобы я также мог отслеживать наши (исследовательский персонал) достижения и логистику. Например, мы получили уведомление, когда появились новые потенциальные субъекты, которые были заинтересованы в участии. Мы смогли отметить номера отслеживания FedEx вместе с записями по соответствующим темам.

В основном это работало хорошо.

4 голосов
/ 03 октября 2010

Звучит так, будто у тебя есть медицинское исследование. Есть множество проблем, которые приходят на ум только от того, что вы описали, что вы хотите сделать. Не последним из которых является конфиденциальность. Где это будет проходить? Получили ли вы согласие пациентов на сбор и передачу информации в электронном виде? Какие данные вы храните, если таковые имеются, которые можно объединить для представления своей личности.

Лично я держусь подальше от инструментов для онлайн-сбора данных. Я плачу фирме, такой как Ipsos, Research Now / E-Rewards, за программирование и управление сбором данных с использованием разработанных мной анкет. Причина в том, что умение проектировать исследования и анализировать данные - это одно. Но если вы обучались статистике - я могу с уверенностью утверждать, что вы «не знаете дерьмо» о сборе данных. Конечно, вы можете знать кое-что о теории выборки, но когда дело доходит до ввода данных - лучше оставить это профессионалам.

Доступен ряд инструментов онлайн-сбора данных "промышленного качества".

  • Подтвердить (в значительной степени золотой стандарт для онлайн-сбора данных)
  • DASH (Меньшее количество подписчиков, но невероятно гибкое)

Существуют также чисто веб-решения, некоторые из которых бесплатны (не то, чтобы я рекомендовал их использовать)

  • QuestionPro
  • SurveyMonkey
  • Zoomerang

Хотя, если вы не проводите исследование с более чем 50 пациентами, я бы просто рекомендовал врачам или их помощникам заполнить листы Excel и отправить их вашему сотруднику.

Кроме того, маловероятно, что вам понадобится настроить систему имени пользователя / пароля. То, что вы хотите, называется «открытой ссылкой». Когда респонденты нажимают на ссылку и вводят информацию, респондент может добавить информацию об идентификаторе. Вам не нужен пароль, потому что люди могут только вводить информацию, а не читать ее.

Большинство систем, о которых я упоминал выше, основаны на идее отправки по электронной почте респонденту (клиницисту) со ссылкой на веб-опрос. Которые могут быть легко адаптированы к вашим конкретным потребностям и служить напоминанием врачу для заполнения формы.

Если ваши типы вопросов просты. Я уверен, что вы могли бы нанять программиста для создания веб-сайта, на котором есть формы, которые вам нужны, за авторизованным интерфейсом. PHP / MySQL, скорее всего, сработает. Но я бы дважды проверил законы о конфиденциальности в вашей юрисдикции, касающиеся медицинских исследований, прежде чем идти вперед.

0 голосов
/ 08 июля 2014

Самая безопасная платформа для сбора конфиденциальных данных опросов - Confirmit.Здесь задействована кривая обучения - вы будете кодировать в VisualSQL, который используется только в Confirmit.Ответы на опрос будут экспортированы в CSV-файлы, где вы сможете проанализировать свои результаты в R.

Если вы собираете какие-либо конфиденциальные данные или данные, где респондентам нужны уникальные ссылки доступа, чтобы они могли видеть только свою собственную версиюопрос, вы хотите использовать Confirmit.Данные хранятся в центре обработки данных Confirmit, но их данные гораздо более безопасны, чем другие поставщики (т. Е. Третья сторона не сможет взломать ваш опрос и увидеть ответы отдельных лиц или перехватить данные, отправляемые с вашего сайта).ответчик для подтверждения).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...