Как узнать, является ли страница новостной статьей? - PullRequest
0 голосов
/ 18 июня 2020

Я создаю расширение chrome, которое будет показывать мне полезную информацию, когда я читаю новостную статью. Я работаю с 67 сайтами.

У некоторых есть «article», «wcm» или «yyyy / mm / dd», которые единообразны во всей их файловой структуре. И я могу использовать регулярное выражение или просто url.indexOf(str), чтобы знать, что это статья.

Но для более чем 30% это трудно предсказать, если только я go не вернусь к источнику html и не найду что-то, что согласуется с датой или автором, но это кажется немного утомительным и / или жаждет производительности, особенно когда у некоторых есть бесконечная прокрутка внутри содержания статьи.

Интересно, есть ли волшебная альтернатива ...

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...