欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

C语言实现压缩二例

程序员文章站 2022-11-05 11:35:14
一 简单字符串压缩 编写一个字符串压缩程序,将字符串中连续出席的重复字母进行压缩,并输出压缩后的字符串。 压缩规则: 1、仅压缩连续重复出现的字符。比如字符串”abcbc”由...

一 简单字符串压缩

编写一个字符串压缩程序,将字符串中连续出席的重复字母进行压缩,并输出压缩后的字符串。

压缩规则:

1、仅压缩连续重复出现的字符。比如字符串”abcbc”由于无连续重复字符,压缩后的字符串还是”abcbc”。
2、压缩字段的格式为”字符重复的次数+字符”。例如:字符串”xxxyyyyyyz”压缩后就成为”3x6yz”。

 

#include 
#include 
#include 

int main()
{ 
    char str[100] = {'\0'};
    char res[100] = {'\0'};
    scanf("%s",str);
    int length = strlen(str);
    int i=0, j=0, k=0;
    int count = 0;
    do
    {
        if(i < length && str[i++] == str[j])
            count++;
        if(str[i] != str[j])
        {
            if(count <= 1)
                res[k++] = str[j];
            else
            {
                if(count > 1)
                {
                    char temp[10] = {'\0'};
                    itoa(count,temp,10);
                    strcpy(res+k,temp);
                    k+=strlen(temp);
                    res[k++] = str[j];
                }
            }
            j = i;
            count = 0;
        }
    }while(i

 

 

运行情况: C语言实现压缩二例

二 哈夫曼编码

哈夫曼树─即最优二叉树,带权路径长度最小的二叉树,经常应用于数据压缩。 在计算机信息处理中, “哈夫曼编码”是一种一致性编码法(又称“熵编码法”),用于数据的无损耗压缩。这一术语是指使用一张特殊的编码表将源字符(例如某文件中的一个符号)进行编码。这张编码表的特殊之处在于,它是根据每一个源字符出现的估算概率而建立起来的(出现概率高的字符使用较短的编码,反之出现概率低的则使用较长的编码,这便使编码之后的字符串的平均期望长度降低,从而达到无损压缩数据的目的)。这种方法是由david.a.huffman发展起来的。 例如,在英文中,e的出现概率很高,而z的出现概率则最低。当利用哈夫曼编码对一篇英文进行压缩时,e极有可能用一个位 哈弗曼编码在信息论中应用举例哈弗曼编码在信息论中应用举例 (bit)来表示,而z则可能花去25个位(不是26)。用普通的表示方法时,每个英文字母均占用一个字节(byte),即8个位。二者相比,e使用了一般编码的1/8的长度,z则使用了3倍多。若能实现对于英文中各个字母出现概率的较准确的估算,就可以大幅度提高无损压缩的比例。

 

//用c语言实现huffman编码,并计算本节中块的编码
//长度(以位为单位),计算huffman编码的压缩比。
//主程序:
#include
#include

typedef struct hftreenode
{
	int weight; //权重
	int parent; //父节点
	int lchild, rchild;   //两个子节点
}struct, *hfstruct;

typedef struct{
	char code[10];
	int start;
}hcodetype;

void quandct(short(*data)[8], short(*result)[8]);//量化函数
int calweight(short(*result), int(*node), int(*weight));//权重计算
void print_data_screen(short data[8][8]);//数据打印

//待编码数据
short dctdata[8][8] = {
	{ 1149, 38, -43, -10, 25, -83, 10, 40 },
	{ -81, -3, 114, -73, -6, -2, 21, -5 },
	{ 13, -11, 0, -42, 25, -3, 16, -38 },
	{ 1, -61, -13, -12, 35, -23, -18, 4 },
	{ 43, 12, 36, -4, 9, -21, 6, -8 },
	{ 35, -11, -9, -4, 19, -28, -21, 13 },
	{ -19, -7, 20, -6, 2, 2, 11, -21 },
	{ -5, -13, -11, -17, -4, -1, 6, -4 } };

hfstruct create_huffmantree(int *weightpoint, int n);//霍夫曼树创建函数
void huffmancoding(hfstruct ht, hcodetype huffcode[], int n);//霍夫曼编码函数

void main()
{
	int i, j;//循环变量
	int length;//编码节点数
	int totalbits = 0;//计算编码后的总的比特数

	int node[64];//节点数组
	int weight[64];//权重数组

	short quanresult[8][8];//量化结果存储
	quandct(dctdata, quanresult);//数据量化
	printf("量化后的数据:\n");//打印量化数据
	print_data_screen(quanresult);

	length = calweight(*quanresult, node, weight);//计算量化数据的节点与权重,并返回节点数

	int *manode = (int*)malloc(length*sizeof(int));//按有效节点进行分配
	int *maweight = (int*)malloc(length*sizeof(int));//按有效节点进行分配
	for (i = 0; i

C语言实现压缩二例