Найти похожий текст в R - PullRequest
0 голосов
/ 09 мая 2018

У меня есть файл с одним столбцом (назовем его myvalues). Он содержит общий текст в них (пример ниже). В первой строке 3 заказа на покупку, во второй строке один заказ на покупку (тестом who является заказ на покупку), в строке 3 есть 3 заказа на покупку, на самом деле строка 4 - это только один заказ на покупку. Есть ли способ, которым я могу проанализировать это в R, моя цель состоит в том, чтобы определить, какая строка имеет реальные несколько заказов на покупку (в данном случае Row1 и Row3). Визуально я могу понять, что Row1 имеет 3 разных PO, Row # имеет 3 PO, а Row 4, хотя кажется, что 3 PO на самом деле только 1.

Row1 => 123456 556613 456826
Row2 => My PO#124 is the last one
Row3 => ABC-123-XYZ DEF-789-JJJ LMQ-529-333
Row4 => PO1234A LD6975A SHIPPED
...