Вопрос, кажется, сосредоточен на хэшах с точным соответствием, которые мы понимаем лучше, чем подходы ближайших соседей, и действительно стоят того, особенно если люди могут обмениваться тегами и другими метаданными таким образом.
Как отмечает @rjmunro, поиск на основе хеш-функции является популярной идеей в мире P2P, и Bitzi сделал это в значительной степени, хотя они закрылись, и их Bitpedia (Digital Media Encyclopedia) там больше не размещается, хотя некоторые из них по крайней мере все еще доступны на Archive.org.
Bitzi также выпускает программное обеспечение, такое как Bitcollider (SourceForge.net) ,
и схема URI магнита , которая позволяет задавать файл с помощью хэша и, таким образом, является идентификатором на основе содержимого. Различные приложения поддерживают поиск в различных базах данных с помощью URI-адресов Magnet, как описано на этой странице Википедии.
Эта же идея популярна в сцене взлома паролей - см., Например, findmyhash - скрипт Python для взлома хешей с использованием онлайн-сервисов и т. Д.
Если пойти еще дальше, думаю, было бы замечательно, если бы были базы данных и онлайн-репозитории, идентифицирующие контент по хеш-функциям и предоставляющие теги и другие метаданные о контенте с разных точек зрения. Тогда я мог бы оставить свою музыкальную коллекцию в ее первоначальном состоянии (без потерь места и времени для резервного копирования), но все же пометить их сам и добавить другие метаданные через внешние базы данных тегов. Если бы мои приложения знали, как захватывать теги, казалось бы, это было бы намного лучше, чем нынешняя система, в которой мы модифицируем и копируем большие файлы, просто чтобы перемещать теги, например, из. мой рабочий стол на мой телефон.
См. Связанную идею на Независимое хэширование метаданных для идентификации носителя и оптимизации передачи P2P (pdf).