Google Sheets REGEXEXTRACT от Instagram - PullRequest
       34

Google Sheets REGEXEXTRACT от Instagram

0 голосов
/ 28 октября 2019

Я сталкиваюсь с особой проблемой с помощью регулярного выражения.

Я заполняю лист Google результатами поиска Google для подписей в Instagram с использованием следующего повторяющегося шаблона:

A |                          B                                  |    C   |    D
--------------------------------------------------------------------------------
1 | 10.7k Likes, 1.7k Comments - @kristiannairn on Instagram... |        |
2 | 4219 Likes, 176 Comments - @djiglobal on Instagram...       |        |
3 | 1.1m Likes, 209k Comments - @kristiannairn on Instagram...  |        |

Iя безуспешно пытаюсь найти правильную формулу REGEXEXTRACT для извлечения числа лайков с десятичными знаками и обозначений k / m после него и без него, когда оно не существует, для заполнения столбца C , а затем формула REGEXEXTRACT для извлечения количества комментариев с десятичными знаками и обозначениями k / m после него и без него, если оно не существует, для заполнения Столбец D .

До сих пор я смог придумать эту формулу для Столбец C , чтобы извлечь Likes:

=REGEXEXTRACT(B1,"(\.?\d*)\W?(?:Likes)")

Однако он не распознает десятичные дроби и делаетне получить указатели k / m.

У меня та же проблема с Столбцом D формулы комментариев, которые я нашел:

=REGEXEXTRACT(B1,"(\.?\d*)\W?(?:Comments)")

То же самое здесь ... это делаетне распознавать десятичные дробии не выбирает обозначения к / м.

Ответы [ 2 ]

1 голос
/ 28 октября 2019

все, что вам нужно:

=ARRAYFORMULA(IFNA({
 REGEXEXTRACT(B2:B, "(.*) Like"), 
 REGEXEXTRACT(B2:B, ", (.*) Comm")}))

0

0 голосов
/ 28 октября 2019

Для Likes вы можете использовать

(\d+(?:\.\d+)?[km]?)\W*Likes\b

и для Comments,

(\d+(?:\.\d+)?[km]?)\W*Comments\b

См. Демонстрационные примеры regex # 1 и regex demo # 2 . Подтверждение:

enter image description here

Подробности

  • (\d+(?:\.\d+)?[km]?) - Группа 1: следуют 1+ цифрыс необязательной последовательностью . и 1+ цифр, а затем с необязательной k или m
  • \W* - 0+ несловарных символов
  • Likes - aслово Likes
  • \b - граница слова.
...