Существует два набора DataFrame, один из которых «Обучающий набор», другой - «Тестовый набор». Что я хочу сделать, так это перебрать некоторый алгоритм (давайте назовем AAA, которому нужен формат ввода RDD), используя «Набор обучения плюс только одну строку набора тестов», выполнив следующий шаг.
- Объединить весь тренировочный набор + «первую» строку тестового набора.
- Запуск некоторого алгоритма с использованием данных 1 и получение некоторого результата.
- Объединить весь тренировочный набор + «второй» ряд тестового набора.
- Запуск некоторого алгоритма с использованием данных 2 и получение некоторого результата.
- Объединить весь тренировочный набор + «третий» ряд тестового набора.
... повторять до последнего ряда набора тестов.
На самом деле, в руководстве по свечам я проверил, что RDD и DataFrame в свече неизменны, поэтому было невозможно использовать
Testset.map( x => AAA(Trainset.union(x)) )
Также я попытался использовать
Testset.map( x => AAA(Trainset.union(Array(x.get(0).toString.toDouble, x.get(1).toString.toDouble, ... x.get(19).toString.toDouble))
но, это не сработало :(. Есть ли какое-нибудь решение, чтобы сделать возможным вышеупомянутый шаг? Если у вас есть хорошая идея для этой проблемы, пожалуйста, помогите мне.
// Изменить и добавить условие
Из-за трудоемкой проблемы мне нужно использовать параллельные вычисления. Поэтому я не мог использовать «для цикла». Спасибо.