Найти мин. операции соединения для последовательности - PullRequest
16 голосов
/ 20 декабря 2010

Допустим, у нас есть список / массив целых положительных чисел x1, x2, ..., xn.Мы можем выполнить операцию join в этой последовательности, это означает, что мы можем заменить два соседних элемента одним элементом, который является суммой этих элементов.Например:

-> массив / список: [1; 2; 3; 4; 5; 6]

  • мы можем объединить 2 и 3,и заменить их на 5;
  • мы можем объединить 5 и 6 и заменить их на 11;
  • мы не можем присоединиться 2 и 4;
  • мы не можем объединить 1 и 3 и т. Д.

Основная проблема заключается в поиске минимальных операций объединения для данной последовательности, после чегопоследовательность будет отсортирована в порядке возрастания.

Примечание: пустые и одноэлементные последовательности отсортированы в порядке возрастания.

Основные примеры:

  • для [4;6;5;3;9] решение равно 1 (мы объединяем 5 и 3)

  • для [1;3;6;5] решение также 1 (мы объединяем 6 и 5)

Я ищу алгоритм, который решает эту проблему.Это может быть псевдокод, C, C ++, PHP, OCaml или аналогичные (я имею в виду: я бы понял решение, если бы вы написали решение на одном из этих языков).

Ответы [ 6 ]

7 голосов
/ 28 декабря 2010

Это идеальная проблема для решения с использованием динамического программирования, и повторение, описанное @lijie, является совершенно правильным подходом, с несколькими незначительными изменениями, чтобы обеспечить рассмотрение всех возможностей. Есть два ключевых наблюдения: (a) любая последовательность операций объединения приводит к набору непересекающихся суммированных подпоследовательностей исходного вектора, и (b) для оптимальной последовательности соединения, если мы посмотрим на Право любой суммированной подпоследовательности (m ... n), эта часть является оптимальным решением проблемы: "найти оптимальную последовательность соединения для субвектора (n + 1) ... N, такую, что получающийся в результате финал последовательность отсортирована, и все элементы> = sum (m ... n).

Реализация непосредственного повторения, конечно, привела бы к алгоритму экспоненциального времени, но простая настройка с использованием динамического программирования делает его O (N ^ 2), потому что, по существу, все (m, n) пары рассматриваются один раз. Простой способ реализовать рекуррентность с использованием динамического программирования - это иметь структуру данных, индексированную (m, n), которая хранит результаты f (m, n) после их вычисления, чтобы в следующий раз мы вызывали f (m) , п), мы можем посмотреть ранее сохраненные результаты. Следующий код делает это с использованием языка программирования R. Я использую формулировку, в которой мы хотим найти минимальное число объединений, чтобы получить неубывающую последовательность. Для новичков в R, чтобы протестировать этот код, просто скачайте R из любого зеркала (Google «R Project») запустите его и вставьте в консоль два определения функций (f и solve), а затем решите любой вектор, используя «solve (c (...))», как в примеры ниже.

f <- function(m,n) {
  name <- paste(m,n)
  nCalls <<- nCalls + 1 
  # use <<- for global assignment
  if( !is.null( Saved[[ name ]] ) ) {
    # the solution for (m,n) has been cached, look it up
    nCached <<- nCached + 1
    return( Saved[[ name ]] )
  }
  N <- length(vec) # vec is global to this function
  sum.mn <- -Inf 
  if(m >= 1)
    sum.mn <- sum( vec[m:n] )
  if(n == N) { # boundary case: the (m,n) range includes the last number
    result <- list( num = 0, joins = list(), seq = c())
  } else
  {
    bestNum <- Inf
    bestJoins <- list()
    bestSeq <- c()
    for( k in (n+1):N ) {
      sum.nk <- sum( vec[ (n+1):k ] )
      if( sum.nk < sum.mn ) next
      joinRest <- f( n+1, k )
      numJoins <- joinRest$num + k-n-1
      if( numJoins < bestNum ) {
        bestNum <- numJoins
        if( k == n+1 )
          bestJoins <- joinRest$joins else
        bestJoins <- c( list(c(n+1,k)), joinRest$joins )
        bestSeq <- c( sum.nk, joinRest$seq)
      }
    }  
    result <- list( num = bestNum, joins = bestJoins, seq = bestSeq )
  }
  Saved[[ name ]] <<- result
  result
}

solve <- function(input) {
  vec <<- input
  nCalls <<- 0
  nCached <<- 0
  Saved <<- c()
  result <- f(0,0)
  cat( 'Num calls to f = ', nCalls, ', Cached = ', nCached, '\n')
  cat( 'Min joins = ', result$num, '\n')
  cat( 'Opt summed subsequences: ')
  cat( do.call( paste, 
                lapply(result$joins, 
                       function(pair) paste(pair[1], pair[2], sep=':' ))),
       '\n')
  cat( 'Final Sequence: ', result$seq, '\n' )
}

Вот несколько примеров прогонов:

> solve(c(2,8,2,2,9,12))
Num calls to f =  22 , Cached =  4 
Min joins =  2 
Opt summed subsequences: 2:3 4:5 
Final Sequence:  2 10 11 12 

> solve(c(1,1,1,1,1))
Num calls to f =  19 , Cached =  3 
Min joins =  0 
Opt summed subsequences:  
Final Sequence:  1 1 1 1 1 

> solve(c(4,3,10,11))
Num calls to f =  10 , Cached =  0 
Min joins =  1 
Opt summed subsequences: 1:2 
Final Sequence:  7 10 11 

> solve(c (2, 8, 2, 2, 8, 3, 8, 9, 9, 2, 9, 8, 8, 7, 4, 2, 7, 5, 9, 4, 6, 7, 4, 7, 3, 4, 7, 9, 1, 2, 5, 1, 8, 7, 3, 3, 6, 3, 8, 5, 6, 5))
Num calls to f =  3982 , Cached =  3225 
Min joins =  30 
Opt summed subsequences: 2:3 4:5 6:7 8:9 10:12 13:16 17:19 20:23 24:27 28:33 34:42 
Final Sequence:  2 10 10 11 18 19 21 21 21 21 26 46 

Обратите внимание, что минимальное число объединений для последовательности, рассматриваемой @kotlinski, составляет 30, а не 32 или 33.

3 голосов
/ 20 декабря 2010

Алгоритм жадности !

import Data.List (inits)

joinSequence :: (Num a, Ord a) => [a] -> Int
joinSequence (x:xs) = joinWithMin 0 x xs
  where joinWithMin k _ [] = k
        joinWithMin k x xs =
          case dropWhile ((< x) . snd) $ zip [0..] $ scanl1 (+) xs
            of (l, y):_ -> joinWithMin (k + l) y $ drop (l+1) xs
               _ -> k + length xs
joinSequence _ = 0

На каждом шаге захватывайте больше элементов, пока их сумма не станет меньше последней.Если у вас закончились элементы, просто объедините все те, которые остались в предыдущей группе.


Это было неправильно.

Комбинаторный взрыв !

joinSequence :: (Num a, Ord a) => [a] -> Int
joinSequence = joinWithMin 0 0
  where joinWithMin k _ [] = k
        joinWithMin k m xs =
            case dropWhile ((< m) . snd) $ zip [0..] $ scanl1 (+) xs
              of [] -> k + length xs
                 ys -> minimum [ joinWithMin (k+l) y $ drop (l+1) xs 
                               | (l, y) <- ys ]

Просто попробуйте каждое возможное соединение и возьмите минимум.Я не мог придумать умную эвристику для ограничения возврата назад, но это должно быть O (n²) при динамическом программировании и O (2 n ), как написано.

1 голос
/ 23 декабря 2010

Подход динамического программирования:

Пусть исходный массив будет a[i], 0 <= i < N.

Определите f(m, n) как минимальное количество объединений, необходимое для сортировки a[n..N-1], так, чтобывсе элементы в отсортированном подсписке: > (или >=, если требуется другой вариант) сумма a[m..n-1] (пусть сумма пустого списка будет -inf).

базовый регистр f(m, N) = 0 (подсписок пуст).

Рекурсия f(m, n) = min_{n < k <= N s.t. sum(a[n..k-1]) > sum(a[m..n-1])} f(n, k) + k-n-1.Если никакие значения k не подходят, то пусть f(m, n) = inf (что-нибудь >= N также будет работать, потому что есть не более N-1 объединений).

Рассчитайте f(m,n) в порядке убывания mи n.

Тогда желаемый ответ будет f(0,0).

РЕДАКТИРОВАТЬ

Упс, это, по-моему, второй ответ эфиманта, я полагаюХотя я не достаточно знаком с Haskell, чтобы точно знать, что он делает.

0 голосов
/ 04 января 2011

Это код pchalasani в F # с некоторыми изменениями. Памятка похожа, я добавил генератор функций sumRange для сумм за время O (1) и переместил начальную позицию на f 1 0, чтобы пропустить проверку на n = 0 в minJoins.

let minJoins (input: int array) =
    let length = input.Length
    let sum = sumRange input

    let rec f = memoize2 (fun m n ->
        if n = length then
            0
        else
            let sum_mn = sum m n 

            {n + 1 .. length}
            |> Seq.filter (fun k -> sum (n + 1) k >= sum_mn)
            |> Seq.map (fun k -> f (n + 1) k + k-n-1)
            |> Seq.append {length .. length}
            |> Seq.min
        )
    f 1 0

Полный код.

open System.Collections.Generic

// standard memoization
let memoize2 f = 
    let cache = new Dictionary<_, _>()
    (fun x1 x2 -> 
        match cache.TryGetValue((x1, x2)) with
        | true, y -> y
        | _ -> 
            let v = f x1 x2
            cache.Add((x1, x2), v)
            v)

// returns a function that takes two integers n,m and returns sum(array[n:m])
let sumRange (array : int array) =
    let forward = Array.create (array.Length + 1) 0

    let mutable total = 0
    for i in 0 .. array.Length - 1 do
        total <- total + array.[i]
        forward.[i + 1] <- total

    (fun i j -> forward.[j] - forward.[i - 1])

// min joins to sort an array ascending
let minJoins (input: int array) =
    let length = input.Length
    let sum = sumRange input

    let rec f = memoize2 (fun m n ->
        if n = length then
            0
        else
            let sum_mn = sum m n 

            {n + 1 .. length}
            |> Seq.filter (fun k -> sum (n + 1) k >= sum_mn)
            |> Seq.map (fun k -> f (n + 1) k + k-n-1)
            |> Seq.append {length .. length} // if nothing passed the filter return length as the min
            |> Seq.min
        )
    f 1 0

let input = [|2;8;2;2;8;3;8;9;9;2;9;8;8;7;4;2;7;5;9;4;6;7;4;7;3;4;7;9;1;2;5;1;8;7;3;3;6;3;8;5;6;5|]
let output = minJoins input
printfn "%A" output
// outputs 30
0 голосов
/ 03 января 2011

Надеюсь, все будет просто.Вот некоторый псевдокод с экспоненциальным временем.

Function "join" (list, max-join-count, join-count) ->
    Fail if join-count is greater than max-join-count.
    If the list looks sorted return join-count.
    For Each number In List
        Recur (list with current and next number joined, max-join-count, join-count + 1)

Function "best-join" (list) ->
    max-join-count = 0
    while not join (list, max-join-count++)

Вот реализация на Clojure:

(defn join-ahead [f i v]
  (concat (take i v)
          [(f (nth v i) (nth v (inc i)))]
          (drop (+ 2 i) v)))

(defn sort-by-joining
  "Sort a list by joining neighboring elements with `+'"
  ([v max-join-count join-count]
     (if (or (nil? max-join-count)
             (<= join-count max-join-count))
       (if (or (empty? v)
               (= v (sort v)))
         {:vector v :join-count join-count}
         (loop [i 0]
           (when (< (inc i) (count v))
             (let [r (sort-by-joining (join-ahead + i v)
                                      max-join-count
                                      (inc join-count))]
               (or r (recur (inc i)))))))))
  ([v max-join-count]
     (sort-by-joining v max-join-count 0))
  ([v]
     (sort-by-joining v nil 0)))

(defn fewest-joins [v]
  (loop [i 0]
    (if (sort-by-joining v i)
      i
      (recur (inc i)))))

(deftest test-fewest-joins
  (is (= 0 (fewest-joins nil)))
  (is (= 1 (fewest-joins [4 6 5 3 9])))
  (is (= 6 (fewest-joins [1 9 22 90 1 1 1 32 78 13 1]))))
0 голосов
/ 20 декабря 2010

Некоторый код на Haskell:

sortJoin (a:b:c:xs)
    | a <= b    = a : sortJoin (b:c:xs)  
    | a+b <= c  = a+b : sortJoin (c:xs)  
    | otherwise = sortJoin (a:b+c:xs)    
sortJoin (a:b:[]) = if a <= b then [a,b] else [a+b]
sortJoin a@_ = a

edits xs = length xs - length (sortJoin xs)

ОБНОВЛЕНИЕ: Сделано в этой работе с тестом = [2, 8, 2, 2, 8, 3, 8, 9, 9, 2, 9, 8, 8, 7, 4, 2, 7, 5, 9, 4, 6, 7, 4, 7, 3, 4, 7, 9, 1, 2, 5, 1, 8, 7, 3, 3, 6, 3, 8, 5, 6, 5]

... теперь мы получаем:

> sortJoin test
[2,8,12,20,20,23,27,28,31,55]
> edits test
32
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...