После того, как вы получили правильный URL-адрес (например, ответ от pjp ), ваша следующая проблема - «получить содержимое файла PDF в переменную MATLAB». Возможно ли это, зависит от того, что вы подразумеваете под «содержанием» ...
Если вы хотите получить необработанные данные в файле PDF , я не думаю, что в настоящее время есть способ сделать это в MATLAB. Функция URLREAD была первой вещью, о которой я подумал, чтобы прочитать контент из URL в строку, но в документации есть следующее примечание:
s = urlread('url')
читает содержимое
по URL-адресу в строку s
. Если
сервер возвращает двоичные данные, s
будет
быть нечитаемым.
Действительно, если вы попытаетесь прочитать PDF, как в следующем примере, s
содержит некоторый текст, смешанный в основном с мусором:
s = urlread('http://samplepdf.com/sample.pdf');
Если вы хотите получить текст из файла PDF , у вас есть несколько вариантов. Во-первых, вы можете использовать URLWRITE , чтобы сохранить содержимое URL в файл:
urlwrite('http://samplepdf.com/sample.pdf','temp.pdf');
Тогда вы сможете использовать одно из двух представлений на Обмен файлами MathWorks для извлечения текста из PDF:
Если вы просто хотите просмотреть PDF, вы можете просто открыть его в Adobe Acrobat с помощью функции OPEN :
open('temp.pdf');