Справочная информация: в настоящее время я создаю бота Reddit с использованием библиотеки praw с Python 3.7.Одна из вещей, которую должен сделать мой бот, - это проверить последние сообщения в каком-либо подредите, чтобы увидеть, содержат ли они только изображение и ничего больше .
Учитывая, что наReddit (сообщения, которые являются просто загруженным изображением и обычными текстовыми сообщениями с изображением в них), я сначала решил провести различие между этими двумя возможностями.Насколько мне известно, praw не предоставляет никакой функциональности для получения типа сообщения Reddit.
Для обработки сообщений, которые являются просто изображениями и ничем иным, я просто проверяю URL возвращенной praw представление с определенным регулярным выражением :
^http(s)?://i\.redd\.it/\w+\.(png|gif|jpg|jpeg)$
Если URL-адрес совпадает, я просто загружаю изображение.Это работает.С другой стороны, для текстовых сообщений, которые содержат только изображение, я проверяю свойство selftext
, что-то вроде этого для сообщений, которые содержат только изображение и ничего больше:
​\n\nhttps://i.redd.it/xxxxxxxxxx.png
ИспользованиеПриведенное выше регулярное выражение (с удаленными маркерами начала и конца), я могу извлечь URL и убедиться, что через re.findall
есть только один.Тем не менее, как я могу убедиться, что в посте абсолютно нет нет текста (кроме пробелов и этой странной escape-последовательности ​
, что я не понимаю ее цели)?