题目: 最短编辑距离
题意:
将n个字符的字符串a改成m个字符的字符串b最少需要几步, 每次操作有三种选择: 删除a的一个字符, 增加a的一个字符, 修改a的一个字符.
思路:
怎么入手?
判断a和b的长度增删到一直后逐个判断a和b的字符是否相同然后依次修改a吗?
两个问题:
1.如何保证最终答案一定是最小值. 子问题就是如何保证每次插入或者删除的时候都是最优解?
2.代码及其繁琐, 且必然会超时.
动态规划优化:
用数组f[i] [j]表示将a的前i个字符和b的前j个字符匹配所需的最小操作数.
我们考虑最后一步操作(假设前面都已经操作完, 第一步就是前面操作数为0的最后一步).
因为每次操作只可能有三种可能, 那么第一种可能就是将字符a[i]删除得到b[1~j], 显然这要求a[1i-1]已经和b[1j]匹配, 也即f[i-1] [j]+1;
第二种可能就是字符串a[1i]增加一个字符得到b[1j], 显然这要求a[1i]已经和b[1j-1]匹配了, 然后所增加的a[i+1]才能和b[j]匹配. 也即f[i] [j-1]+1;
第三种情况是修改a[i], 分两种情况, 如果a[i]和b[j]相等, 那么显然就不用操作了, 就是f[i-1] [j-1], 如果不同, 那么操作数就要+1, 也即f[i-1] [j-1]+1.
代码:
#include<iostream>
#include<algorithm>
#include<string>
using namespace std;
const int N=1010;
int f[N][N];
int n,m;
string a,b;
int main()
{
cin>>n>>a>>m>>b;
a=" "+a;//字符下标从1开始, 防止遍历时发生越界
b=" "+b;
//初始化
for(int i=1;i<=n;++i)f[i][0]=i;//将a[1~i]删成b[0]需要i步
for(int i=1;i<=m;++i)f[0][i]=i;//将a[0]增加到b[1~i]需要i步
for(int i=1;i<=n;++i)
{
for(int j=1;j<=m;++j)
{
f[i][j]=min(f[i-1][j]+1,f[i][j-1]+1);
//第三种情况需要特判, 如果两个字符串最后一个字符相同就不用改
if(a[i]==b[j])f[i][j]=min(f[i][j],f[i-1][j-1]);
else f[i][j]=min(f[i][j],f[i-1][j-1]+1);
}
}
cout<<f[n][m];
return 0;
}