Похоже, что нужен комбинированный подход, реальные формы должны быть пригодны для автоматической обработки. Вы можете отсканировать документы и просто работать с электронной версией, если ввод с множественным выбором может быть автоматически обработан, вы можете получить лучшие коэффициенты ошибок, не допуская пользователя в цикл. В зависимости от пакета OCR, я думаю, вы получите обратно значение, которое скажет вам, насколько система делает выбор, который вы сделали, в зависимости от этого значения вы захотите, чтобы форма была проверена человеком. Заметьте, я говорю об использовании ocr для меток множественного выбора, а не записей произвольной формы, что, вероятно, само по себе является проблемой.
Параллельно вы, вероятно, захотите выполнить случайные проверки, чтобы найти коэффициент ошибок системы ocr. Затем это значение можно использовать для определения значения достоверности для суммы вопроса с множественным выбором.
Я думаю, что подобный подход был бы полезен, если вы просто работаете с людьми, вы, вероятно, не избавитесь от всех ошибок, потому что люди будут делать ошибки, и они будут делать ошибки, исправляя ошибки, но с достаточно большим размером выборки вы вероятно, сможет определить соотношение ошибок при вводе человеком. Этот номер затем можно использовать для определения результатов опроса.
Что касается других идей пользовательского интерфейса, вы можете использовать отсканированные формы и накладывать их таким образом, чтобы флажок пользовательского интерфейса был близок к письменному флажку. Если у вас есть пара известных линий под углами, выпрямление и масштабирование формы не должно быть слишком сложным. Если элемент ввода пользовательского интерфейса близок к отметкам карандашом, скорее всего, вы получите более высокие показатели для правильной классификации.
Вы также можете, вероятно, использовать статистический анализ для выбора форм, которые кажутся несоответствующими, но вы можете искажать результат из-за неравномерного выбора, который может быть хуже, чем равномерная случайная ошибка. В зависимости от дизайна бумажного опроса может быть полезно скопировать это в пользовательском интерфейсе, всем будет легче находить ошибки, если они выглядят одинаково, если вы не будете придерживаться этого, возможно, некоторые из ссылок на опрос дизайн (например, это может быть полезным.
Это, кажется, довольно большая операция, я уверен, что в штате есть несколько статистиков, поговорите с ними о том, что им нужно и что вы можете сделать, чтобы помочь им, и не должны делать это, чтобы исказить результаты еще больше.