Я сделал это для приложения библиотеки электронных книг. Прежде всего вам нужно извлечь текст из файла CHM или PDF. Для этого есть множество утилит \ библиотек. Вот статья о CodeProject о том, как извлечь содержимое из файлов CHM. Для файлов PDF я использовал утилиту pdftotext .
Когда вы получаете простой текст из электронной книги, проанализируйте его, используя регулярное выражение , чтобы найти код ISBN10 / 13.