欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  Office

excel 求唯一值个数公式(详细汇总)

程序员文章站 2022-03-04 19:09:58
excel唯一值个数7种公式,带大括号的为数组公式,需要按CTRL+SHIFT+ENTER三键结束输入 1 {=SUM(1/COUNTIF(B1:B44,B1:B...

excel唯一值个数7种公式,带大括号的为数组公式,需要按CTRL+SHIFT+ENTER三键结束输入

1 {=SUM(1/COUNTIF(B1:B44,B1:B44))}

2 {=SUM(N(MATCH(B1:B44,B1:B44,)=ROW(1:44)))}

3 {=SUMPRODUCT((B1:B44<>"")/COUNTIF(B1:B44,B1:B44&""))}

4 =SUMPRODUCT(1/COUNTIF(B1:B44,B1:B44))

5 {=SUM(N(FREQUENCY(B2:B45,B2:B45)>0))}

6 {=SUM(--(MATCH(B1:B44,B1:B44,)=ROW(1:44)))}

7{ =SUM(--(FREQUENCY(B1:B44,B1:B44)>0))}

Excel 中用公式列出唯一值——模拟高级筛选功能

在 Excel 中处理数据时,我们经常会遇到包含重复数值的列。比如,员工表或客户表的城市一列,又比如商品销售清单的商品名称一栏。数据处理工作的一个内容可能就是列出这些数据的唯一值,看看哪些城市有客户,供应商或员工,看看哪些商品被卖了出去。这个任务用 Excel 的高级筛选功能是非常容易做到的。不过,也许是出于对算法的追求,有一个用公式的解法来列出唯一值。我不是这个公式的原创者,但还是很愿意解释一下这个公式,看一下例子吧。

  A B C D
1 城市   城市 位置
2 上海   上海 2
3 上海   北京 4
4 北京   广州 5
5 广州   南京 7
6 广州   0 11
7 南京    #N/A #N/A
8 北京      
9 上海      
10 广州      

A 栏是包含了重复值的一列城市名,我们要在 C 栏用公式列出唯一的城市名。示例数据中我们用到了列名“城市”,这是个好的习惯,因为用高级筛选功能也是要求原始数据有列名的。

在 C2 输入 =INDEX(A:A,MATCH(0,COUNTIF(C$1:C1,$A$1:$A$11),)),按 CTRL+SHIFT+ENTER 作为数组公式输入。下面来解释一下这个公式的构造:

要在 C 栏列出唯一值,肯定要在原始数据,即 A 栏中进行查找,这是最外面的 INDEX 公式的用处。现在的问题变成,如何构造一个公式能返回每个值第一次出现时的位置。接下来考察一下 Match 这个公式,在 D2 输入 =MATCH(0,COUNTIF(C$1:C1,$A$1:$A$11),),也是按 CTRL+SHIFT+ENTER 作为数组公式输入,从结果可以看出,D 栏列出了每个唯一值在 A 栏第一次出现时的序号或位置。

这个问题可以这样考虑,如果我们能在 C 栏通过公式列出唯一值,那么假定我们已经列出了一部分唯一值。接下来的那个唯一值,也即 A 栏中将要取出的那个值,在 C 栏已有的唯一值列表中是找不到的。也就是说,将要取出的那个值,在 C 栏已有的唯一值列表中出现次数是0。它上面的那些值都已经在  C 栏已有的唯一值列表中出现过了,否则也不会轮到它。这就是 Match 函数要从一个序列中查找 0 值的意义所在。那么,怎么构建一个序列,对应 A 栏中的数据是否在 C 栏中出现过呢?这个序列应该是类似 {1,0,0,1,1,0,……}这个样子,因为 C 栏是唯一值,对于 A 栏中的每个数据在 C 栏中只可能出现一次,返回一个 1,不出现就返回 0。当这个数据在 A 栏中重复出现时,又会返回一个 1,我们期望的序列是和 A 栏的数据一一对应的,对应关系是——这个值是否在 C 栏已有列表中出现过。

用 CountIf 函数来构造这个序列,我只能说这是基于对数组函数和 CountIf 函数本身的及其熟稔才能做到的。CountIf 函数返回的序列的大小(元素个数)和它的第二个参数的大小是一致的。就这个例子而言,COUNTIF(C$1:C1,$A$1:$A$11),表示对 $A$1:$A$11 中的每个数据在 C$1:C1 中进行查找,返回一个是否存在的 0,1值序列。

这个问题的另一个技巧就是 C$1:C1 的半固定表示法。当公式向下复制的时候,C1 会增长为 C2,C3 等等,永远只在已有的唯一值列表中查找。对于 Excel,这是个递归的计算。我们的逻辑,也是用归纳法推出来的。