Как выполнить строковые различия в Java? - PullRequest
44 голосов
/ 25 сентября 2008

Мне нужно выполнить Diffs между строками Java. Я хотел бы иметь возможность перестроить строку с использованием оригинальной версии строки и diff. Кто-нибудь делал это на Java? Какую библиотеку вы используете?

String a1; // This can be a long text
String a2; // ej. above text with spelling corrections
String a3; // ej. above text with spelling corrections and an additional sentence

Diff diff = new Diff();
String differences_a1_a2 = Diff.getDifferences(a,changed_a);
String differences_a2_a3 = Diff.getDifferences(a,changed_a);    
String[] diffs = new String[]{a,differences_a1_a2,differences_a2_a3};
String new_a3 = Diff.build(diffs);
a3.equals(new_a3); // this is true

Ответы [ 7 ]

46 голосов
/ 25 сентября 2008

Эта библиотека, кажется, делает свое дело: google-diff-match-patch . Он может создать строку исправления из различий и позволить повторно применить исправление.

edit : Другое решение может быть https://code.google.com/p/java-diff-utils/

21 голосов
/ 25 сентября 2008

Apache Commons имеет строковую разницу

org.apache.commons.lang.StringUtils

StringUtils.difference("foobar", "foo");
4 голосов
/ 18 июля 2009

Библиотека утилит java может быть полезна.

4 голосов
/ 25 сентября 2008

Как говорит Торстен, вы можете использовать

org.apache.commons.lang.StringUtils;

System.err.println(StringUtils.getLevenshteinDistance("foobar", "bar"));
1 голос
/ 25 сентября 2008

Если вам нужно иметь дело с различиями между большими объемами данных и эффективно их сжимать, вы можете попробовать реализацию xdelta на Java, которая, в свою очередь, реализует RFC 3284 (VCDIFF) для двоичных различий (должна работать и со строками) .

0 голосов
/ 29 ноября 2016
public class Stringdiff {
public static void main(String args[]){
System.out.println(strcheck("sum","sumsum"));
}
public static String strcheck(String str1,String str2){
    if(Math.abs((str1.length()-str2.length()))==-1){
        return "Invalid";
    }
    int num=diffcheck1(str1, str2);
    if(num==-1){
        return "Empty";
    }
    if(str1.length()>str2.length()){
        return str1.substring(num);
    }
    else{
        return str2.substring(num);
    }

}

public static int diffcheck1(String str1,String str2)
{
    int i;
    String str;
    String strn;
    if(str1.length()>str2.length()){
        str=str1;
        strn=str2;
    }
    else{
        str=str2;
        strn=str1;
    }
    for(i=0;i<str.length() && i<strn.length();i++){
            if(str1.charAt(i)!=str2.charAt(i)){
                return i;
            }
    }
        if(i<str1.length()||i<str2.length()){
            return i;
        }

    return -1;

   }
   }
0 голосов
/ 25 сентября 2008

Используйте Расстояние Левенштейна и извлеките журналы редактирования из матрицы, которую строит алгоритм. Статья в Википедии ссылается на пару реализаций, я уверен, что среди них есть реализация Java.

Левенштейн - это особый случай алгоритма Longest Common Subsequence , вы также можете захотеть взглянуть на него.

...