加载中...

【题解】最短编辑距离题解


题目: 最短编辑距离

题意:

将n个字符的字符串a改成m个字符的字符串b最少需要几步, 每次操作有三种选择: 删除a的一个字符, 增加a的一个字符, 修改a的一个字符.

思路:

怎么入手?
判断a和b的长度增删到一直后逐个判断a和b的字符是否相同然后依次修改a吗?
两个问题:
1.如何保证最终答案一定是最小值. 子问题就是如何保证每次插入或者删除的时候都是最优解?
2.代码及其繁琐, 且必然会超时.

动态规划优化:
数组f[i] [j]表示将a的前i个字符和b的前j个字符匹配所需的最小操作数.
我们考虑最后一步操作(假设前面都已经操作完, 第一步就是前面操作数为0的最后一步).
因为每次操作只可能有三种可能, 那么第一种可能就是将字符a[i]删除得到b[1~j], 显然这要求a[1i-1]已经和b[1j]匹配, 也即f[i-1] [j]+1;
第二种可能就是字符串a[1i]增加一个字符得到b[1j], 显然这要求a[1i]已经和b[1j-1]匹配了, 然后所增加的a[i+1]才能和b[j]匹配. 也即f[i] [j-1]+1;
第三种情况是修改a[i], 分两种情况, 如果a[i]和b[j]相等, 那么显然就不用操作了, 就是f[i-1] [j-1], 如果不同, 那么操作数就要+1, 也即f[i-1] [j-1]+1.

代码:

#include<iostream>
#include<algorithm>
#include<string>

using namespace std;

const int N=1010;

int f[N][N];
int n,m;
string a,b;

int main()
{
    cin>>n>>a>>m>>b;
    a=" "+a;//字符下标从1开始, 防止遍历时发生越界
    b=" "+b;

    //初始化
    for(int i=1;i<=n;++i)f[i][0]=i;//将a[1~i]删成b[0]需要i步
    for(int i=1;i<=m;++i)f[0][i]=i;//将a[0]增加到b[1~i]需要i步
    
    for(int i=1;i<=n;++i)
    {
        for(int j=1;j<=m;++j)
        {
            f[i][j]=min(f[i-1][j]+1,f[i][j-1]+1);
            //第三种情况需要特判, 如果两个字符串最后一个字符相同就不用改
            if(a[i]==b[j])f[i][j]=min(f[i][j],f[i-1][j-1]);
            else f[i][j]=min(f[i][j],f[i-1][j-1]+1);
        }
    }
    
    cout<<f[n][m];
    return 0;

}


文章作者: 心意
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 心意 !
评论
  目录