Когда мне приходилось иметь дело с большими наборами данных и большими наборами параметров для нелинейного подбора параметров, я использовал комбинацию RANSAC и Левенберга-Марквардта. Я говорю о тысячах параметров с десятками тысяч точек данных.
RANSAC - это надежный алгоритм для минимизации шума из-за выбросов с использованием сокращенного набора данных. Это не совсем наименьшие квадраты, но может применяться ко многим подходящим методам.
Левенберг-Марквардт - эффективный способ численного решения нелинейных наименьших квадратов.
Скорость сходимости в большинстве случаев находится между методом наискорейшего спуска и методом Ньютона, не требуя вычисления вторых производных. Я обнаружил, что он быстрее, чем градиент сопряжения в рассмотренных случаях.
То, как я это сделал, было настроить RANSAC на внешнюю петлю вокруг метода LM. Это очень надежно, но медленно. Если вам не нужна дополнительная надежность, вы можете просто использовать LM.