Извлечение URL из HTML-текста для конкретного текста ссылки в дополнении Gmail - PullRequest
0 голосов
/ 28 февраля 2019

Я пытаюсь получить href (s) из документа HTML (электронная почта Gmail), в котором есть текст ссылки "cats"

Например, я хочу извлечь URL из ссылок ниже, которые будут где угоднов HTML-документе

<a href="https://www.google.com/search?q=cats&oq=cats" target="_blank">cats</a>
or 
<a href="https://www.google.com/search?q=cats&oq=cats" target="_blank">yay cats</a>

Примечание. Я создаю надстройку Gmail

1 Ответ

0 голосов
/ 28 февраля 2019

Поиск ссылок и прочего в электронном письме с регулярными выражениями Gmail Addon

Это тестер регулярных выражений, поэтому он, вероятно, больше, чем вы ожидали, но найдет ссылки, которые вы ищете, а также любые другие.другие вы хотите найти.Этот будет работать для ваших текущих потребностей: <.*q=cats.*>.Используемая в настоящее время функция регулярного выражения - String.match, вы можете найти ее объяснение здесь В нижней части страницы есть URL, который должен указывать на электронную таблицу, которая содержит страницу с именем «По умолчанию», как будет объяснено позже.

function buildAddOn(e) {
  var accessToken = e.messageMetadata.accessToken;
  GmailApp.setCurrentMessageAccessToken(accessToken);
  var msg=GmailApp.getMessageById(e.messageMetadata.messageId).getPlainBody();
  setDefaults({message:msg});
  var cards = [];
  cards.push(buildRegexTester(getDefaults()));
  return cards;
}

function buildRegexTester(dfltObj){
  var card=CardService.newCardBuilder();
  card.setHeader(CardService.newCardHeader().setTitle('Regex Tester'));
  var section=CardService.newCardSection().setHeader('Email Body Search');
  var plainBodyText=CardService.newTextParagraph().setText(dfltObj.message);
  section.addWidget(plainBodyText)
  var saveRegexButton=CardService.newTextButton().setText('Save Regex').setOnClickAction(CardService.newAction().setFunctionName('saveRegex'));
  section.addWidget(saveRegexButton);
  var regexTextBox=CardService.newTextInput()
  .setFieldName('Regex')
  .setTitle('Regex')
  .setMultiline(true)
  .setValue(dfltObj.Regex);
  section.addWidget(regexTextBox);
  var searchButton=CardService.newTextButton().setText('Search').setOnClickAction(CardService.newAction().setFunctionName('search')); 
  section.addWidget(searchButton);
  var regexResultBox=CardService.newTextInput()
  .setFieldName('Results')
  .setTitle('Results')
  .setMultiline(true)
  .setValue(dfltObj.results);
  section.addWidget(regexResultBox);
  var clearResultsButton=CardService.newTextButton().setText('Clear Results').setOnClickAction(CardService.newAction().setFunctionName('clearResults'));
  section.addWidget(clearResultsButton)
  var g_toggle=CardService.newKeyValue()
  .setContent('global search')
  .setSwitch(CardService.newSwitch()
            .setSelected(dfltObj.g)
            .setFieldName('g')
            .setValue('g')
            .setOnChangeAction(CardService.newAction().setFunctionName('saveFlags')));
  section.addWidget(g_toggle);
  var i_toggle=CardService.newKeyValue()
  .setContent('ignore case')
  .setSwitch(CardService.newSwitch()
            .setSelected(dfltObj.i)
            .setFieldName('i')
            .setValue('i')
            .setOnChangeAction(CardService.newAction().setFunctionName('saveFlags')));
  section.addWidget(i_toggle);
  var m_toggle=CardService.newKeyValue()
  .setContent('multiline search')
  .setSwitch(CardService.newSwitch()
            .setSelected(dfltObj.m)
            .setFieldName('m')
            .setValue('m')
            .setOnChangeAction(CardService.newAction().setFunctionName('saveFlags')));
  section.addWidget(m_toggle);
  card.addSection(section);
  return card.build();
}

function getDefaults(){
  var ss=SpreadsheetApp.openByUrl(RegexTesterAddon_URL);
  var sh=ss.getSheetByName('Defaults');
  var rg=sh.getDataRange();
  var vA=rg.getValues();
  var dfltObj={};
  for(var i=0;i<vA.length;i++){
    dfltObj[vA[i][0]]=vA[i][1];
  }
  return dfltObj;
}

function setDefaults(dfltObj){
  var ss=SpreadsheetApp.openByUrl(RegexTesterAddon_URL);
  var sh=ss.getSheetByName('Defaults');
  var rg=sh.getDataRange();
  var vA=rg.getValues();
  for(var i=0;i<vA.length;i++){
    if(typeof(dfltObj[vA[i][0]])!='undefined'){
      vA[i][1]=dfltObj[vA[i][0]];
    } 
  }
  rg.setValues(vA);
}

function saveFlags(e){
  Logger.log('\nsaveFlags():\n%s\n',e);
  var g=(typeof(e.formInput.g)!='undefined')?true:false;
  var i=(typeof(e.formInput.i)!='undefined')?true:false;
  var m=(typeof(e.formInput.m)!='undefined')?true:false;
  var flagObj={g:g,i:i,m:m};
  setDefaults(flagObj);
}

function saveRegex(e){
  Logger.log('\nsaveRegex():\n%s',e);
  var regex=(typeof(e.formInput.Regex)!='undefined')?e.formInput.Regex:'';
  if(regex){
    var rObj={Regex:regex};
    setDefaults(rObj);
  }
}

function saveResults(rsltObj){
  setDefaults(rsltObj);
}

function getFlags(){
  var dfltObj=getDefaults();
  var flagsA=[];
  if(dfltObj.g){flagsA.push('g');}
  if(dfltObj.i){flagsA.push('i');}
  if(dfltObj.m){flagsA.push('m');}
  var flags=flagsA.join('');
  return flags;  
}

function search(e){
  Logger.log('\nSearch():\n%s',e);
  if(typeof(e.formInput.Regex)!='undefined'){
    saveFlags(e);
    saveRegex(e);
    var dfltObj=getDefaults();
    var flags=getFlags();
    var pattern=dfltObj.Regex;
    Logger.log('\nflags: %s\npattern: %s',flags,pattern);
    var re=new RegExp(pattern,flags);
    //var result=re.exec(dfltObj.message);
    var result=dfltObj.message.match(re);
    if(result) {
      Logger.log('\nresult: %s\nmessage:',result,dfltObj.message);
      if(result){
        var rsltLog='';
        for(var i=0;i<result.length;i++){
          if(i>0){rsltLog+='\n'};
          rsltLog+='result[' + i + ']= ' + result[i];
        }
      }
      console.log('module: %s pattern: %s regex: %s flags: %s result: %s length: %s',"findData()",pattern,re,flags,rsltLog,result.length);
    }
    if(result){
      var results=rsltLog;
    }else{
      var results="No Results";
    }
    //var rsltObj={results:results};
    var rsltObj={results:escapeHtml(results)};
    saveResults(rsltObj);
    return buildRegexTester(getDefaults());
  }
}

function clearResults(e){
  var dfltObj=getDefaults();
  dfltObj.results='';
  return buildRegexTester(dfltObj);
}

//Came From: @Kip https://stackoverflow.com/a/4835406/7215091
function escapeHtml(text) {
  var map = {
    '&': '&amp;',
    '<': '&lt;',
    '>': '&gt;',
    '"': '&quot;',
    "'": '&#039;'
  };

  return text.replace(/[&<>"']/g, function(m) { return map[m]; });
}

var RegexTesterAddon_URL='link to a spreadsheet that contain defaults';

Электронная таблица должна иметь страницу с именем По умолчанию, и она выглядит следующим образом:

enter image description here

Страница использует только столбцы A иB и он должен иметь сообщение, Regex, g, i, m и результаты, как показано на рисунке.Типичная настройка для g, i, m - ИСТИНА, ЛОЖЬ, ЛОЖЬ, с которых вы можете начать.Это регулярное выражение работает для ваших текущих требований <.*q=cats.*>

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...