Мой вопрос таков:
Мне нужно прочитать большой XML-файл, 50 МБ; и анонимизировать некоторые теги / поля, относящиеся к личным вопросам, такие как имя, фамилия, адрес, адрес электронной почты, номер телефона и т. д. *
Я точно знаю, какие теги в XML должны быть анонимными.
s|<a>alpha</a>|MD5ed(alpha)|e;
s|<h>beta</h>|MD5ed(beta)|e;
, где alpha
и beta
относятся к любым символам внутри, которые также будут хэшироваться, используя, вероятно, такой алгоритм, как MD5 .
Я буду конвертировать только значение тега, а не сами теги.
Надеюсь, я достаточно ясно о своей проблеме. Как мне этого добиться?