Я не уверен, каковы ваши критерии для "нечитаемых" и "испорченных", но в соответствии с файлом README для SCOWL :
Ударения присутствуют в определенных словах
например, кафе в формате iso8859-1 .
Три слова, которые вы упомянули, это эклеры, эклеры и эклеры, с которыми все в порядке.
Если бы вы могли опубликовать ту часть кода, которая доставляет вам неприятности, возможно, кто-то может помочь вам в дальнейшем. Это проблема программирования, верно? :)