最短编辑距离

题目描述

  

1.1 输入描述:

  UNIX系统下有一个行编辑器ed,它每次只对一行文本作删除一个字符、插入一个字符或替换一个字符三种操做。例如某一行的内容是“ABC”,通过把第二个字符替换成“D”、删除第一个字符、末尾插入一个字符“B”,这三步操做后,内容就变成了“DCB”。即“ABC”变成“DCB”须要通过3步操做,咱们称它们的编辑距离为3。 
  如今给你两个任意字符串(不包含空格),请帮忙计算它们的最短编辑距离。 java

1.2 输出描述:

  输入包含多组数据。每组数据包含两个字符串m和n,它们仅包含字母,而且长度不超过1024。算法

1.3 输入例子:

ABC CBCD
ABC DCB
  •  

1.4 输出例子:

2
3
  •  

2 解题思路

  设A和B是2个字符串。要用最少的字符操做将字符串A转换为字符串B。这里所说的字符操做包括: 
  (1) 删除一个字符; 
  (2) 插入一个字符; 
  (3) 将一个字符改成另外一个字符。 
  将字符串A变换为字符串B所用的最少字符操做数称为字符串A到B的编辑距离。设A的长度为m,B的长度为n建立一个二维数组d,大小为(m+1)*(n+1),来记录a1-am与b1-bn之间的编辑距离,要递推时,须要考虑对其中一个字符串的删除操做、插入操做和替换操做分别花费的开销,从中找出一个最小的开销即为所求结果。 
  操做步骤: 
  (一) 状况一:当A的长度为0,B的长度为j时,最小编辑距离就是j。 
  (二) 状况二:当A的长度为i,B的长度为0时,最小编辑距离就是i。 
  (三) 状况三:当A的长度为i,B的长度为j时,d[i][j]=min{d[i-1][j]+1,d[i][j-1]+1, d[i-1][j-1]+(A[i]==B[j]?0:1)} 
  其中: 
   ● d[i][j]表示A的前i个字符和B的前j个字符相同后的最短距离。 
   ● d[i][j]来自于三种状态 
    ■ 删除,d[i-1][j]+1,A1,…,Ai-1通过操做能够变成了B1,…,Bj,那么A1,…,Ai-1Ai变为B1,…,Bj必定要删除Ai。 
    ■ 插入,d[i][j-1]+1,A1,…,Ai通过操做能够变成了B1,…,Bj-1Bj,那么A1,…,Ai-1Ai变为B1,…,Bj-1Bj必定要添加一个字符。 
    ■ 替换,若是A[i]=B[j],能够不进行额外的操做,那么有d[i][j]=d[i-1][j-1],若是不A[i]≠B[j],那么就要进行一次替换操做,有d[i][j]=d[i-1][j-1]+1。 
  注意:此处字符串中字符开始的下标从1开始计算 
  根据分析能够获得递推方程: 
 数组

d[i][j]=⎧⎩⎨jimin{d[i−1][j]+1,d[i][j−1]+1,d[i−1][j−1]+f(i,j)}i=0j=0i>0andj>0编辑器

 

f(i,j)={10i>0andj>0andA[i]≠B[j]i>0andj>0andA[i]=B[j]测试

 

3 算法实现

import java.util.Scanner;

/**
 * Declaration: All Rights Reserved !!!
 */
public class Main {
    public static void main(String[] args) {
        Scanner scanner = new Scanner(System.in);
//        Scanner scanner = new Scanner(Main.class.getClassLoader().getResourceAsStream("data.txt"));
        while (scanner.hasNext()) {
            String s = scanner.next();
            String t = scanner.next();

            System.out.println(shortest(s, t));

        }

        scanner.close();
    }

    /**
     * 最短编辑距离
     *
     * @param s 字符串
     * @param t 字符串
     * @return 最短编辑距离
     */
    private static int shortest(String s, String t) {

        int row = s.length() + 1;
        int col = t.length() + 1;

        // 初始化
        int[][] d = new int[row][col];
        for (int i = 0; i < row; i++) {
            d[i] = new int[col];
        }

        // 设置第一列
        for (int i = 0; i < row; i++) {
            d[i][0] = i;
        }

        // 设置第一行
        for (int j = 0; j < col; j++) {
            d[0][j] = j;
        }

        for (int i = 1; i < row; i++) {
            for (int j = 1; j < col; j++) {
                int u = d[i - 1][j] + 1;
                int v = d[i][j - 1] + 1;
                int w = d[i - 1][j - 1];
                if (s.charAt(i - 1) != t.charAt(j - 1)) {
                    w++;
                }

                d[i][j] = Math.min(u, Math.min(v, w));
            }
        }

        return d[row - 1][col - 1];
    }
}
  •  

4 测试结果

这里写图片描述

相关文章
相关标签/搜索