У меня есть следующая задача. У меня есть 50M строк транзакций. Я не могу экспортировать его в файл .txt, но у меня есть связь с моим Hive, и я создал таблицу с транзакциями: Transcation_id Item 1 A 1 B 1 C 2 A 2 A
Я не могу использовать
order_trans <- read.transactions(
file = "(...)/trans2019.csv",
format = "single",
header=TRUE,
sep = ",",
cols=c("trans_id","item"),
rm.duplicates = T,
encoding = "UTF-16LE")
, потому что это обрезает транзакции.
Я хотел бы сделать то же самое, но вместо «Файл» я хотел бы поместить свой фрейм данных (trans_id, item), но он не работает. Я также пытался:
trans = as(data.frame,"transactions")
, но тогда алгоритм apriori дает мне неправильные правила
APPLE - >action_ID
Может кто-нибудь помочь мне с этим?