Я использовал gmail api для получения содержимого электронной почты, а затем в node.js я преобразовал его в строку.
Buffer.from(dataToDecode, 'base64').toString('utf8')
Затем я использую регулярное выражение для поиска дат в тексте.например, 27 февраля 2019 года
/[A-Z][a-z]{2} [0-9]{2}, [0-9]{4}/g
Это не дает соответствия, но когда я утешаю содержание, дата присутствует.А затем я копирую дату в некоторые онлайн-инструменты для декодирования. Оказывается, что
\xe2\x80\x8c\x46\xe2\x80\x8c\x65\xe2\x80\x8c\x62\xe2\x80\x8c\x20\xe2\x80\x8c\x32\xe2\x80\x8c\x37\xe2\x80\x8c\x2c\xe2\x80\x8c\x20\xe2\x80\x8c\x32\xe2\x80\x8c\x30\xe2\x80\x8c\x31\xe2\x80\x8c\x39\xe2\x80\x8c\x0a
и
\x46\x65\x62\x20\x32\x37\x2c\x20\x32\x30\x31\x39
могут давать одно и то же «27 февраля 2019 года».Как использовать регулярное выражение для захвата кодировки первого типа (т. Е. Более длинной кодировки)?