Trie树 (状压DP)

程序员文章站 2022-07-12 17:14:45

...

题目描述

字母（Trie）树是一个表示一个字符串集合中所有字符串的前缀的数据结构，其有如下特征：
1.树的每一条边表示字母表中的一个字母
2.树根表示一个空的前缀
3.树上所有其他的节点都表示一个非空前缀，每一个节点表示的前缀为树
根到该节点的路径上所有字母依次连接而成的字符串。
4.一个节点的所有出边（节点到儿子节点的边）中不存在重复的字母。

Trie树 (状压DP)

单词“A”“to”“tea”“ted”“ten”“i”“in”“inn”对应的Trie树

现在Matej手上有N个英文小写字母组成的单词，他想知道，如果将这N个单词中的字母分别进行重新排列，形成的字母树的节点数最少是多少。

输入

第一行包含一个正整数N（1<=N<=16）
接下来N行每行一个单词，每个单词都由小写字母组成。
单词的总长度不超过1,000,000。

输出

输出仅一个正整数表示N个单词经过重新排列后，字母树的最少节点数。

样例输入

3
a
ab
abc

样例输出

无脑排序建字典树输出cnt，然后发现根本就不是字典树的题目啊，然后发现N == 16，明显可以状压，然后就没有了然后。可以想到状压，但是并无法找到状态转移，0代表不选，1代表选择选择，怎么用前面得到的最优解去更新后面出现的值，所以果断认为这题属于不看题解不会系列。看了题解之后，也理解了半天，最后打出枚举子集的表，才敢相信这算法的神奇。不看半天题，都不好意思AC。

首先从最基础的两个单词看起：当两个单词的相同字母尽量多的时候，此时的Tire树的节点数是最少的。但是可以发现，当单词数目>=3的时候，此结论是不成立的，那么可不可以当单词数>=3时，分成若干个两两相交的状态，从而得到最优解呢？答案是可以的，这就是位运算神奇的地方。

然后考虑枚举每个状态子集的两个状态，这两种状态无非是将当前状态的每一位的1分到两个子状态里面，但是要确保两个子状态的当前位不同时为1，然后，下面这句话即可完成枚举状态: for(j = i;j;j = (j-1)&i)

最后考虑DP部分，根据一开始的分析，很容易得到状态转移，找到所有串的公共部分sum，用最后枚举得到的dp[i]跟sum做差，得到当前的最优状态。状态需要从小的集合到大的集合过渡，只有子结构最优的前提下，才能得到最优的当前状态，然后考虑dp[i] == sum的时候，说明此时的所有选择的串都相同，也就不存在需要减去的情况，故只有当dp[i] > sum时，才需要dp[i]-sum。

最后需要结果+1.字典树的根节点是空值。收获：高效枚举子状态for(j = i;j;j = (j-1)&i)

部分细节见代码：

/*
Look at the star
Look at the shine for U
*/ 

#include<bits/stdc++.h>
#define sl(x) scanf("%lld",&x)
using namespace std;
typedef long long ll;
const int N = 1e6+5;
const ll mod = 1e9+7;
const int INF = 0x3f3f3f3f;
int dp[N],vis[30][30],len[N];
char s[N];
int main()
{
	int n,i,j,k;
	scanf("%d",&n);
	for(i = 0;i < n;i++)
	{
		scanf("%s",s); len[i] = strlen(s);
		for(j = 0;s[j];j++) vis[i][s[j]-'a']++;     //记录第i串，每个字母出现的次数 
	}
	int temp = (1<<n);
	for(i = 0;i < temp;i++)    //状态
	{
		int sum = 0;
		for(j = 0;j < n;j++) if((1<<j)&i) dp[i] += len[j];      //最多需要的节点数
		//统计每个字符串中公共单词的个数
		for(j = 0;j < 26;j++)
		{
			int minn = INF;
			for(k = 0;k < n;k++) if((1<<k)&i) minn = min(minn,vis[k][j]);
			sum += minn;
		}
		for(j = i;j;j = (j-1)&i)
        {
            dp[i] = min(dp[i],dp[j]+dp[i^j]);
        //    cout<<"i = "<<i<<"       "<<j<<"<--->"<<(i^j)<<endl;
        }
        if(dp[i] > sum) dp[i] -= sum;
	}
	printf("%d\n",dp[(1<<n)-1]+1);
}

Trie树 (状压DP)

洛谷P4590 [TJOI2018]游园会(状压dp LCS)

loj#10172 涂抹果酱 (状压DP)

中石油acm4985: Going Dutch 还钱问题（状压dp）

洛谷P2761 软件补丁问题(状压DP,SPFA)

洛谷P2704 [NOI2001]炮兵阵地(状压dp)

【状压dp】[HDU1400 & poj2411] Mondriaan‘s Dream

Trie树 (状压DP)

BZOJ4006: [JLOI2015]管道连接(斯坦纳树,状压DP)

BZOJ2595: [Wc2008]游览计划(斯坦纳树,状压DP)

牧场的安排（状压dp）