Что такое правильное регулярное выражение RE2 для извлечения подстроки из строки, содержащей цифры, символы и символы? - PullRequest
1 голос
/ 12 июня 2019

Я пытаюсь извлечь подстроку, содержащую «числа, имя файла и расширение», из сложного имени файла. Это должно быть повторено для списка имен файлов.

file1 = "Apple_Or_Orange_1_2_3_4_filename_1.pdf" file2 = "Apple_Or_Orange_5_6_7_8_filename_2.pdf"

Все это в электронной таблице Google.

Так как это в электронной таблице Google, я пытаюсь использовать функцию spreadsheetApp.regextract ().

Эта функция принимает только регулярные выражения формата RE2.

regex = "^ [^ Drive_By_Wire_Safety_Case _] \ d | \ w |." Но это не дает желаемого результата.

Ожидаемый результат output1 = "1_2_3_4_filename_1.pdf" output2 = "5_6_7_8_filename_2.pdf"

1 Ответ

0 голосов
/ 12 июня 2019

Вы можете извлечь текст, используя

REGEXEXTRACT(A1, "^Apple_Or_Orange_(.+)")

См. Демонстрационный пример регулярных выражений и график регулярных выражений :

enter image description here

(.+) - это группа захвата , которая при использовании в шаблоне регулярных выражений захватывает (часть) совпадения, а REGEXEXTRACT возвращает только эту часть.

...