Проверьте http://www.microtask.com. (я не связан с этой компанией.)
Возможно, вам удастся создать широкую сеть с вашими регулярными выражениями, а затем попросить работников по работе выяснить реальные адреса, номера телефонов и адреса электронной почты. Является ли «такой-то и такой-то» адрес, номер телефона или адрес электронной почты - довольно простой вопрос для человека.
Поскольку они разбирают форму (или говорят, что я ее использую - я ее не использовал), вам не нужно беспокоиться о проблемах конфиденциальности или, возможно, сможете их оправдать. Если у MicroTask есть сотни клиентов, они могут взять все микрозадачи и выбросить их в гигантский бункер, который рандомизирует, какие из них видит каждый отдельный работник. Следовательно, они могут фактически гарантировать, что у работников почти не будет средств для сопоставления какой-либо конфиденциальной информации, с которой они работают. Каждый работник будет видеть тысячи независимых частей информации каждый день. В этих условиях, кто сможет различить, что Задача 347 в первый день имела адрес электронной почты, соответствующий Задаче 1133 в третий день? Даже если бы они могли, это вряд ли стоит им. Они, вероятно, заработают больше денег, просто делая то, что от них требуется.