При наличии достаточных данных для обучения есть замечательная библиотека Python для достижения таких вещей, как https://github.com/snipsco/snips-nlu
Что вы можете сделать, это взять примеры из как можно большего количества статей, которые включают названия книг, следовать документации по этому хранилищу, и вы сможете найти названия книг из статей, предполагая, что они следуют шаблону, подобному вашему. пример данных.
Я не уверен на 100%, что это задача для машинного обучения. Может быть более простой способ, такой как поиск слов / фраз, которые заключены в кавычки, выделены курсивом и т. Д. Люди не обязательно знают, что группа слов является названием книги, поэтому мы придумали пунктуацию, чтобы явно сделать это Чисто. Мне кажется, что в вашем решении должен быть какой-то смысл использовать этот синтаксис, если это возможно.