欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

[题解] 哈夫曼编码(附图分析)

程序员文章站 2022-06-02 12:55:01
...

“Don’t bark up the wrong Binary Tree.”

【问题描述】

  我们称树的带权路径长度(WPL)最小的二叉树为“哈夫曼树”或“最优二叉树”。

  哈夫曼树对字符进行编码,称为哈夫曼树编码(Huffman Coding)。哈夫曼编码是一种编码方式,哈夫曼编码是可变字长编码的一种。Huffman于1952年提出一种编码方法,该方法完全依据字符出现概率来构造异字头的平均长 度最短的码字,有时称之为最佳编码,一般就叫作Huffman编码。

  现在给定 n 个字符在文章中出现的频率:W[1], W[2],…, W[n],给每个字符赋予一个01串,使得任意一个字符的编码不是另一个字符编码的前缀(哈夫曼编码),而且编码的总长度(每个字符的频率于编码长度的乘积总和)尽量小。

【输入格式】

  第一行是一个整数n,表示n个字符的出现频率。
  以下n行,每行有三一个整数W[i]。
  

【输出格式】

  一个整数,表示n个字符的编码总长度。

【输入样例】

6
45
13
12
16
9
5

【输出样例】

224

【数据范围】

n<=40000,w[i]<=50000


一些小分析~

about题目样例:
[题解] 哈夫曼编码(附图分析)
不正经的公式证明(大概是这个意思就好了( ̄▽ ̄)/):
[题解] 哈夫曼编码(附图分析)


#include<algorithm>
#include<iostream>
#include<fstream>
#include<cstdio>
#include<queue>
using namespace std;

priority_queue<int,vector<int>, greater<int> > q;

int main(){
    //freopen(".in","r",stdin);
    //freopen(".out","w",stdout);
    int n;
    scanf("%d",&n);
    for(int i=1;i<=n;i++){
        int t;
        scanf("%d",&t);
        q.push(t);
    }

    long long sum=0; 
    while(!q.empty()){
        int not_leaf=0;

        if(q.size()>=2){
            //取两次最小值合成非叶节点 
            not_leaf+=q.top();
            q.pop();
            not_leaf+=q.top();
            q.pop();

            sum+=not_leaf;//sum(W[i]·P[l]=非叶节点权值和)
            q.push(not_leaf);   
        }
        else break;
    }
    printf("%lld",sum);
    return 0;
}

[转载请标明出处 , 谢谢]

相关标签: 题解