Является ли расстояние Левенштейна правильным способом решения этой проблемы с правкой шагов? - PullRequest
2 голосов
/ 30 мая 2009

Я знаком с расстоянием Левенштейна, поэтому я решил использовать его для решения проблемы с лестницей редактирования шагов UVA.

Мое решение:

import java.io.*;
import java.util.*;

class LevenshteinParaElJuez implements Runnable{
    static String ReadLn(int maxLength){  // utility function to read from stdin,
                                          // Provided by Programming-challenges, edit for style only
        byte line[] = new byte [maxLength];
        int length = 0;
        int input = -1;
        try{
            while (length < maxLength){//Read untill maxlength
                input = System.in.read();
                if ((input < 0) || (input == '\n')) break; //or untill end of line ninput
                line [length++] += input;
            }

            if ((input < 0) && (length == 0)) return null;  // eof
            return new String(line, 0, length);
         }catch (IOException e){
            return null;
        }
    }

    public static void main(String args[]) // entry point from OS
    {
        LevenshteinParaElJuez myWork = new LevenshteinParaElJuez();  // Construct the bootloader
        myWork.run();            // execute
    }

    public void run() {
        new myStuff().run();
    }
}
class myStuff implements Runnable{
    public void run(){

        ArrayList<String> theWords = new ArrayList<String>();
        try
        {

        /// PLACE YOUR JAVA CODE HERE

        String leido=LevenshteinParaElJuez.ReadLn(100);

        //System.out.println("lo leido fue "+leido);

        while (leido.length() != 0){
        theWords.add(leido);
        leido=LevenshteinParaElJuez.ReadLn(100);
        }


        }catch(Exception e){
            System.out.println("El programa genero una excepcion");
        }


        int maxEdit=0;
        int actualEdit=0;

     int wordsIndex1 =0, wordsIndex2=0;


     while (wordsIndex1<= theWords.size())
     {
      while (wordsIndex2<= theWords.size()-1){
         actualEdit=Levenshtein.computeLevenshteinDistance(theWords.get(wordsIndex1),theWords.get(wordsIndex2));
         if (actualEdit>maxEdit){maxEdit=actualEdit;}
         wordsIndex2++;
      }
     wordsIndex1++;

     }

     System.out.println(maxEdit+1);



    }


}
class Levenshtein {
    private static int minimum(int a, int b, int c) {
        if(a<=b && a<=c)
            return a;
        if(b<=a && b<=c)
            return b;
        return c;
    }

    public static int computeLevenshteinDistance(String str1, String str2) {
        return computeLevenshteinDistance(str1.toCharArray(),
                                          str2.toCharArray());
    }

    private static int computeLevenshteinDistance(char [] str1, char [] str2) {
        int [][]distance = new int[str1.length+1][str2.length+1];

        for(int i=0;i<=str1.length;i++)
                distance[i][0]=i;

        for(int j=0;j<=str2.length;j++)
            distance[0][j]=j;

        for(int i=1;i<=str1.length;i++)
            for(int j=1;j<=str2.length;j++)
                distance[i][j]= minimum(distance[i-1][j]+1,
                                        distance[i][j-1]+1,
                                        distance[i-1][j-1]+
                                        ((str1[i-1]==str2[j-1])?0:1));

        return distance[str1.length][str2.length];
    }


}

С этим входом:

cat
dig
dog
fig
fin
fine
fog
log
wine

выдает правильный вывод для этого образца:

5

Судья отклоняет мой ответ. Это моя первая попытка решить проблему с онлайн-судьей, и я думаю, что, возможно, вынуждаю дать правильный ответ здесь:

 System.out.println(maxEdit+1);

, поскольку maxEdit имеет значение 4, когда вычисляется просто с помощью Левенштейна. Это то, что происходит?

Ответы [ 2 ]

2 голосов
/ 31 мая 2009

Левинштейн актуален, но не даст вам значения, используемого в вашем выводе. В этой задаче используйте его, чтобы определить, имеют ли два слова расстояние редактирования ровно 1, указывая, что два сравниваемых слова смежны в шаге редактирования.

Переберите слова в слове. и если следующее слово имеет расстояние редактирования 1 от текущего слова, вы можете сделать это текущее слово, в противном случае оно должно быть пропущено.

Хитрость в этой проблеме заключается в поиске всех возможных последовательностей - то, что следующее слово имеет расстояние редактирования 1, не означает, что его использование в лестнице даст вам максимально длинную лестницу. *

1 голос
/ 30 мая 2009

Проблема состоит в том, что вы должны найти самую длинную лексикографически упорядоченную (то есть алфавитную) последовательность в словаре, так что каждое слово в последовательности формируется путем добавления, удаления или изменения одной буквы.

Таким образом, 5 в образце результата для последовательности (копать, рис, плавник, штраф, вино).

Я не думаю, что Левенштейн особенно подходит к этой проблеме, хотя, может быть, я просто недостаточно изобретателен. Левенштейн не фиксирует требование, чтобы каждый шаг был в словаре, а затем в словаре.

...