У меня есть столбец «product_list» в кадре данных, который выглядит следующим образом: «; 165533; 3; 1050.00;,; 165535; 1; 700.00;
Это список продуктов, купленных в рамках покупки id. В приведенном выше примере 165533 - это SKU, 3 - это количество приобретенных продуктов, 1050.00 - это сумма покупки и т. д. Это поле может содержать несколько SKU для продукта. Несколько SKU разделены запятой. Я хочу извлечь только из SKU эта строка в R с использованием регулярного выражения, с которым я новичок.
Мой вопрос заключается в том, как извлечь только первое значение из значений, разделенных запятыми.
структура dput (Purchase_test [, c (1, 2)]) (список (post_purchaseid = c (123L, 456L, 321L, 888L, 345L, 938L) , 647L, 657L, 687L, 547L, 647L, 711L, 811L, 911L, 1001L), post_product_list = структура (c (6L, 4L, 11L, 9L, 2L, 5L, 7L, 1L, 3L, 4L, 10L, 8L, 4L, 12L, 13L), .Label = c ("; 153147; 1 ; 100,00;;; 165533; 1; 350,00;;; 165537; 1; 3800,00; ","; 153147; 1; 100,00;;; 165533; 3; 1050,00;;; 165531; 1; 200,00;;; 165535; 1 ; 700,00; ","; 153147; 1; 100,00;;;; 165533; 3; 1050,00;;;; 165536; 1; 2750,00; ","; 153147; 1; 100,00;;; 165535; 1; 700,00; "," ; 153147; 1; 100,00;;; 165535; 2; 1400,00; ","; 153147; 1; 12,05;,; 165531; 1; 24,11;;; 153418; 5; 500,00; ","; 153147; 1; 15,34 ;,; 165533; 1; 53,70; ","; 153147; 1; 31,51;;; 153418; 2; 200,00; ","; 153147; 1; 43,84;;; 165531; 1; 87,67; ","; 153147 ; 1; 49,86;,; 165533; 1; 174,52; ","; 165533; 3; 1050,00;,; 165535; 1; 700,00; ","; создание первого текста; 1; 4200,00; 207 = 4200,00;,; Начало работы с; 1; 3900,00; 207 = 3900,00; ","; Начало работы с; 1; 3900,00; 207 = 3900,00; "), class =" factor ")), class =" data.frame ", row.names = c (NA, -15L))