Просто расширить Гурмбо - это ответ. Использование mb_substr решит вашу проблему, но, тем не менее, если специальные символы появляются в конце, когда вы отключаетесь, все равно отображаются некоторые специальные символы. Поэтому, когда я провел какое-то исследование, Wordpress имел метод wp_html_excerpt , чтобы решить эту проблему.
Метод wp_html_excerpt удаляет эти специальные символы в конце строки.
Вот исходный код из WordPress.
/**
* Safely extracts not more than the first $count characters from html string.
*
* UTF-8, tags and entities safe prefix extraction. Entities inside will *NOT*
* be counted as one character. For example & will be counted as 4, < as
* 3, etc.
*
* @since 2.5.0
*
* @param string $str String to get the excerpt from.
* @param int $count Maximum number of characters to take.
* @param string $more Optional. What to append if $str needs to be trimmed. Defaults to empty string.
* @return string The excerpt.
*/
function wp_html_excerpt( $str, $count, $more = null ) {
if ( null === $more )
$more = '';
$str = wp_strip_all_tags( $str, true );
$excerpt = mb_substr( $str, 0, $count );
// remove part of an entity at the end
$excerpt = preg_replace( '/&[^;\s]{0,6}$/', '', $excerpt );
if ( $str != $excerpt )
$excerpt = trim( $excerpt ) . $more;
return $excerpt;
}