Разбор HTML: Системы классификации взрослых - PullRequest
2 голосов
/ 19 августа 2010

Я изучаю различные и (иногда устаревшие) рейтинги / классификационные стандарты, используемые в Интернете. то есть PICS , ПОРОШОК , ICRA

Какой стандарт является самым популярным (количество сайтов, использующих его)?

Существует ли библиотека C #, которая будет обрабатывать любую (или все) из них?

1 Ответ

0 голосов
/ 09 мая 2013

Вы не должны больше использовать PICS .Начиная с http://www.w3.org/2007/powder/:

POWDER заменил PICS как рекомендуемый метод описания веб-сайтов и создания приложений, которые действуют на основе таких описаний.Сравнение PICS и POWDER доступно отдельно .

В связанном документе вы можете прочитать:

Это означает, что W3C не рекомендует никакихдальнейшее развитие программного обеспечения, использующего PICS, варианты использования которого покрыты POWDER, что дает значительные преимущества, как описано ниже.

ICRA прекращено :

По состоянию на октябрь 2010 года механизм маркировки ICRA был снят с производства FOSI.Кроме того, FOSI отозвал всю поддержку системы рейтингов ICRA и снял всю документацию для маркировки веб-сайтов рейтингами ICRA.Причина в том, что этикетка ICRA не получила широкого распространения.


Итак, мы должны использовать ПОРОШОК .

Однако, POWDER - это только фреймворк, так что вам все равно понадобится классификация (или словарь RDF) для оценки контента, которую вы можете использовать с POWDER.POWDER Primer включает пример с использованием словаря ICRA , FWIW.

См. Связанный с этим вопрос: Существуют ли какие-либо альтернативы ICRA для саморегулируемой маркировки контента сайтов?

...