数据流中的中位数

程序员文章站 2022-04-09 18:01:55

对于数据流，对应的就是在线算法了，一道很经典的题目就是在1亿个数中找到最大的前100个数，这是一道堆应用题，找最大的前100个数，那么我们就创建一个大小为100的最小化堆，每来一个元素就与堆顶元素比较，因为堆顶元素是目前前100大数中的最小数，前来的元素如果比该元素大，那么就把原来的堆顶替换掉。那 ......

对于数据流，对应的就是在线算法了，一道很经典的题目就是在1亿个数中找到最大的前100个数，这是一道堆应用题，找最大的前100个数，那么我们就创建一个大小为100的最小化堆，每来一个元素就与堆顶元素比较，因为堆顶元素是目前前100大数中的最小数，前来的元素如果比该元素大，那么就把原来的堆顶替换掉。

那么对于这一道题呢？如果单纯的把所有元素放到一个数组里，每次查找中位数最快也要o(n)，综合下来是o(n^2)的复杂度。我们可以利用上面例子中的想法，用一个最大堆来维护当前前n/2小的元素，那么每次找中位数只到取出堆顶就可以了。但是，有一个问题，数据要动态增长，有可能之前被替换掉的元素随着元素的增加又跑回来了，所以我们不能单纯得向上题一样把元素丢掉，我们可以再用一个最小化堆来存前n/2大的元素。

上一篇：洛谷P4555 [国家集训队]最长双回文串(manacher 线段树)

下一篇： Python基础——概述

数据流中的中位数

JSP中遇到的一些问题

PHP中ob_start函数的使用说明_PHP

php数组中包含中文的排序方法_PHP

探讨fckeditor在Php中的配置详解_PHP教程

php中把美国时间转为北京时间的自定义函数分享，美国北京时间_PHP教程

Python中类的定义、继承及使用对象实例详解

PHP统计目录中文件数量以及目录中目录大小的方法

C#中异步编程4async与await异步程序开发的实例分析

destoon安全设置中需要设置可写权限的目录及文件_PHP

ODBC中遇到的错误_MySQL