Я использую textract AWS для документов, но, похоже, он не обнаруживает, если текст выделен жирным шрифтом. Чего-то мне не хватает или это просто не функция?
Обнаружение полужирного текста, по-видимому, не является текущей функцией в Textract.
API Textract возвращает строк и слов текста в объекте Block.
Тип данных блочного объекта задокументирован как https://docs.aws.amazon.com/textract/latest/dg/API_Block.html и не имеет каких-либо свойств, связанных с весом шрифта (например, жирным шрифтом).