Я работаю над ссылочным веб-приложением в рамках курса, который я изучаю, цель которого - дать студентам возможность быстро и легко ссылаться на материалы, в которых они находят информацию, и я сталкиваюсь с несколькими проблемами с вещи.
Первый - получение даты публикации статьи / сайта. При работе со статическими сайтами HTML это легко, так как я могу просто использовать document.lastModified, чтобы узнать время его последнего изменения. Проблемы возникают при работе с гораздо более распространенным веб-сайтом на основе CMS, поскольку страницы генерируются динамически, что приводит к тому, что document.lastModified всегда возвращает эквивалент «сейчас» ... что совсем не точно.
Существуют шаги, которые разработчики сайтов могут предпринять, чтобы сделать это немного проще с реализацией HTML5, а именно с добавлением элемента, который может иметь дополнительные атрибуты, определяющие его как время публикации публикации. Такие сайты хороши, но подавляющее большинство сайтов не используют HTML5, и я не думаю, что это изменится в ближайшее время. У кого-нибудь есть идеи о том, как точно определить, когда был создан пост?
Второй - точное определение автора поста или страницы. Есть несколько способов определить это. Во-первых, если сайт использовал микроформат hAtom для идентификации элементов сайта, что облегчает задачу ... но, как и в случае с датами публикации, это не распространено.
Следующим будет просмотр метаданных сайта и определение автора на основе содержимого, хранящегося там. Это необычно, и, как правило, владелец сайта или другое лицо, не ответственное за публикацию, оставляет его ненадежным для использования в качестве ресурса.