欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

TOJ 1238: 统计难题

程序员文章站 2024-03-19 08:15:58
...

描述

Ignatius最近遇到一个难题,老师交给他很多单词(只有小写字母组成,不会有重复的单词出现),现在老师要他统计出以某个字符串为前缀的单词数量(单词本身也是自己的前缀).

输入

输入数据的第一部分是一张单词表,每行一个单词,单词的长度不超过10,它们代表的是老师交给Ignatius统计的单词,一个空行代表单词表的结束.第二部分是一连串的提问,每行一个提问,每个提问都是一个字符串.
注意:本题只有一组测试数据,处理到文件结束.

输出

对于每个提问,给出以该字符串为前缀的单词的数量.

样例输入

banana
band
bee
absolute
acm

ba
b
band
abc

样例输出

2
3
1
0

方法一:map大法
将每一个字符串的每个前缀都用map存起来,然后再根据提问字符串输出
代码如下(感觉十分暴力-_-)

#include<bits/stdc++.h>
using namespace std;
map<string,int>mp;
int main()
{
    char s[11];
    while(gets(s),s[0])
    {
        int n=strlen(s);
        for(int i=n-1;i>=0;--i)
        {
            mp[s]++;
            s[i]='\0';
        }
    }
    while(gets(s))printf("%d\n",mp[s]);
    return 0;
}

方法二:字典树
感觉map大法太过暴力,于是上百度了解到了找到了字典树这个好东西 (以前自己想到过这样存字符串,但当时感觉太麻烦了就没去想) 于是花了点时间初步了解了一下,虽然内存复杂度有点高,但它的查找效率很高(虽然没有达到O(1) )。
代码????

#include<bits/stdc++.h>
using namespace std;
struct node
{
    int cnt;
    node *next[26];
    node()
    {
        cnt=0;
        memset(next,0,sizeof(next));
    }
};
node *root=new node;
void creat(char *s)
{
    node *tmp=root;
    for(int i=0;s[i];i++)
    {
        if(tmp->next[s[i]-'a']==NULL)
            tmp->next[s[i]-'a']=new node;
        tmp=tmp->next[s[i]-'a'];
        tmp->cnt++;
    }
}
int fd(char *s)
{
    node *tmp=root;
    for(int i=0;s[i];i++)
    {
        tmp=tmp->next[s[i]-'a'];
        if(tmp==NULL)return 0;
    }
    return tmp->cnt;
}
int main()
{
    char s[11];
    while(gets(s),s[0]!='\0')creat(s);
    while(gets(s))
        printf("%d\n",fd(s));
    return 0;
}

感觉对上面代码的效率还不是很满意,于是用数组模拟了一下内存分配,稍微提了一下速度 (本来想计算一下数组开多大的合适的,但感觉有点麻烦,就大致试了一下)
代码????

#include<bits/stdc++.h>
using namespace std;
struct node
{
    int cnt;
    int next[26];
    node()
    {
        cnt=0;
        memset(next,0,sizeof(next));
    }
};
node adre[200000];
int nx=0,root=0;
void creat(char *s)
{
    int tmp=root;
    for(int i=0;s[i];i++)
    {
        if(adre[tmp].next[s[i]-'a']==0)
            adre[tmp].next[s[i]-'a']=++nx;
        tmp=adre[tmp].next[s[i]-'a'];
        adre[tmp].cnt++;
    }
}
int fd(char *s)
{
    int tmp=root;
    for(int i=0;s[i];i++)
    {
        tmp=adre[tmp].next[s[i]-'a'];
        if(!tmp)return 0;
    }
    return adre[tmp].cnt;
}
int main()
{
    char s[11];
    while(gets(s),s[0]!='\0')creat(s);
    while(gets(s))
        printf("%d\n",fd(s));
    return 0;
}

另外我还在网上看到了hash+字典树的做法可以进一步优化,奈何本人菜,不会hash,只能先用用基础的方法做做。
嘿嘿,看来我得找个时间去学学hash,等学会了hash再来^ _ ^;