Я пробовал около 6 различных пакетов для чтения файлов .do c, и ни один из них не очень хорошо справлялся с кодировкой на иврите. Если у кого-то есть решение, буду очень признателен! Я пробовал «readr», «textreadr», «readtext», «tm» и «antiword». Проблема всегда одна и та же, выводя вопросительные знаки там, где должны быть буквы на иврите, например:
> readr::read_document("F:/worm/H201502750_388971_3.doc")
[1] "????? ????? ???? ????? ??' 02-5429496"
[2] "??? ??????? ????????? ???' 02-5429674"
[3] "?????? ?????? ????? ?. ?????