面试遇到的两个题

程序员文章站 2022-05-20 20:04:58

...

第一个：
机器内存为2GB，但有个5GB的文件里面全是以逗号分割的数字，现在我们要进行对他排序，排序好不能重复（不能用DB）;

第二个：
给出你一个数找到相邻的数字（12，222，500，888，991，1000）
比如：我给的是13，那么相邻最近的是12。我给的是998，那么相邻最近的是1000

回复内容：

第一个：
机器内存为2GB，但有个5GB的文件里面全是以逗号分割的数字，现在我们要进行对他排序，排序好不能重复（不能用DB）;

第二个：
给出你一个数找到相邻的数字（12，222，500，888，991，1000）
比如：我给的是13，那么相邻最近的是12。我给的是998，那么相邻最近的是1000

第一个问题是典型的外排序问题，最简单的方法就是归并排序，详见https://zh.wikipedia.org/wiki/%E5%A4%96%E6%8E%92%E5%BA%8F

第二个问题可以通过二分法找到给的数字相邻两边的数字。

你这个文件二分的时候需要向前或者向后找到临近的逗号，然后再读取逗号两边的数。

第一个可以用外排，但如果数字都是整数的话，用位图会更简单，一次完成排序+去重
第二个，给出的数字集合是有序的吗？如果是，直接二分查找即可。

堆排序应该能适应一维海量数据的排序需求。
一维的最近邻查询。如果也要支持海量数据，那么数据结构可以用 B 树，在对 B 树进行深度优先遍历的过程中进行剪枝，不断向最近邻目标逼近。如果只是在内存里查找最近邻，用二叉搜索树也行。

其实用第 2 种方法我说的 B 树，也可以解决第 1 个问题。先建 B 树，然后从文件中最小的数据开始，以此寻找最近邻就可以了。比如最小数据为 a，从树中删除 a，再查询它的最近邻，得到 b，从树中删除 b，现在就有了 a->b。继续查询 b 的最近邻，得到 c，从树中删除 c，这样就得到 a->b->c……以此类推。时间复杂度应该是 O(nlog n)的。

相关标签： php 算法数据结构和算法 java c

上一篇： JavaScript的Form常规验证写法

下一篇： js正则查找match()与替换replace()用法实例

面试遇到的两个题

回复内容：

Java面试中遇到的坑【填坑篇】

面试真题：求100万内的质数

JavaScript面试题：一道关于变量提升的题

新手使用Android Studio会遇到的两个问题和解决办法

山阳公和安乐公相比两个爵位的待遇到底有多大

面试刷题16:synchronized和ReentrantLock的区别？

【前端刷题笔记02】字节跳动2019面试题-一只想做全栈的猫-SegmentFault思否

面试刷题2:Exception和Error的区别?

面试刷题1: 简要介绍java平台？java是解释执行的吗？

分享3道关于面试中会遇到的python的编程题，附题解

面试遇到的两个题

回复内容：

Java面试中遇到的坑【填坑篇】

面试真题：求100万内的质数

JavaScript面试题：一道关于变量提升的题

新手使用Android Studio会遇到的两个问题和解决办法

山阳公和安乐公相比 两个爵位的待遇到底有多大

面试刷题16:synchronized和ReentrantLock的区别？

【前端刷题笔记02】字节跳动2019面试题-一只想做全栈的猫-SegmentFault思否

面试刷题2:Exception和Error的区别?

面试刷题1: 简要介绍java平台？java是解释执行的吗？

分享3道关于面试中会遇到的python的编程题，附题解

山阳公和安乐公相比两个爵位的待遇到底有多大