Предполагая, что вы используете Python 3, мне удалось исправить это следующим образом:
s = '<h1 itemprop="name">Pen­ne met sa­la­mi en broc­co­li</h1>'
s.replace("­", '').replace(";\xad","").replace("\xad","")
, что дало мне следующее:
'<h1 itemprop="name">Penne met salami en broccoli</h1>'