У меня очень простой вопрос, потому что я абсолютный новичок. Я пытался найти помощь в Интернете и читать различные учебные пособия и руководства, но не могу найти ответ.
Мой проект очень прост. У меня есть десятки PDF-файлов (хранятся в папке), которые я хочу проанализировать на предмет их содержания (обучение без учителя). Конечная цель - тематический анализ. Теперь вот проблема: каждое руководство, которое я могу найти, прыгает прямо в предварительную обработку этих текстов, не проходя через первые шаги загрузки этих файлов в R и определения корпуса.
Итак, в основном, я хочу разбить все эти PDF-файлы в рамках данных для анализа, но я пропускаю первый шаг загрузки их в R.
Любая помощь будет принята с благодарностью.