算法分析

程序员文章站 2022-03-12 08:02:03

...

【转自cs-note】

数学模型
注意事项
ThreeSum
倍率实验

数学模型

1. 近似

N³/6-N²/2+N/3 ~ N³/6。使用 ~f(N) 来表示所有随着 N 的增大除以 f(N) 的结果趋近于 1 的函数。

2. 增长数量级

N³/6-N²/2+N/3 的增长数量级为 O(N³)。增长数量级将算法与它的具体实现隔离开来，一个算法的增长数量级为 O(N³) 与它是否用 Java 实现，是否运行于特定计算机上无关。

3. 内循环

执行最频繁的指令决定了程序执行的总时间，把这些指令称为程序的内循环。

4. 成本模型

使用成本模型来评估算法，例如数组的访问次数就是一种成本模型。

注意事项

1. 大常数

在求近似时，如果低级项的常数系数很大，那么近似的结果是错误的。

2. 缓存

计算机系统会使用缓存技术来组织内存，访问数组相邻的元素会比访问不相邻的元素快很多。

3. 对最坏情况下的性能的保证

在核反应堆、心脏起搏器或者刹车控制器中的软件，最坏情况下的性能是十分重要的。

4. 随机化算法

通过打乱输入，去除算法对输入的依赖。

5. 均摊分析

将所有操作的总成本除于操作总数来将成本均摊。例如对一个空栈进行 N 次连续的 push() 调用需要访问数组的次数为 N+4+8+16+…+2N=5N-4（N 是向数组写入元素的次数，其余都是调整数组大小时进行复制需要的访问数组次数），均摊后访问数组的平均次数为常数。

ThreeSum

ThreeSum 用于统计一个数组中和为 0 的三元组数量。

public interface ThreeSum {
    int count(int[] nums);
}

1. ThreeSumSlow

该算法的内循环为 if (nums[i] + nums[j] + nums[k] == 0) 语句，总共执行的次数为 N(N-1)(N-2) = N³/6-N²/2+N/3，因此它的近似执行次数为 ~N³/6，增长数量级为 O(N³)。

public class ThreeSumSlow implements ThreeSum {
    @Override
    public int count(int[] nums) {
        int N = nums.length;
        int cnt = 0;
        for (int i = 0; i < N; i++) {
            for (int j = i + 1; j < N; j++) {
                for (int k = j + 1; k < N; k++) {
                    if (nums[i] + nums[j] + nums[k] == 0) {
                        cnt++;
                    }
                }
            }
        }
        return cnt;
    }
}

2. ThreeSumBinarySearch

将数组进行排序，对两个元素求和，并用二分查找方法查找是否存在该和的相反数，如果存在，就说明存在和为 0 的三元组。

应该注意的是，只有数组不含有相同元素才能使用这种解法，否则二分查找的结果会出错。

该方法可以将 ThreeSum 算法增长数量级降低为 O(N²logN)。

public class ThreeSumBinarySearch implements ThreeSum {

    @Override
    public int count(int[] nums) {
        Arrays.sort(nums);
        int N = nums.length;
        int cnt = 0;
        for (int i = 0; i < N; i++) {
            for (int j = i + 1; j < N; j++) {
                int target = -nums[i] - nums[j];
                int index = BinarySearch.search(nums, target);
                // 应该注意这里的下标必须大于 j，否则会重复统计。
                if (index > j) {
                    cnt++;
                }
            }
        }
        return cnt;
    }
}

public class BinarySearch {

    public static int search(int[] nums, int target) {
        int l = 0, h = nums.length - 1;
        while (l <= h) {
            int m = l + (h - l) / 2;
            if (target == nums[m]) {
                return m;
            } else if (target > nums[m]) {
                l = m + 1;
            } else {
                h = m - 1;
            }
        }
        return -1;
    }
}

3. ThreeSumTwoPointer

更有效的方法是先将数组排序，然后使用双指针进行查找，时间复杂度为 O(N²)。

同样不适用与数组存在重复元素的情况。

public class ThreeSumTwoPointer implements ThreeSum {

    @Override
    public int count(int[] nums) {
        int N = nums.length;
        int cnt = 0;
        Arrays.sort(nums);
        for (int i = 0; i < N - 2; i++) {
            int l = i + 1, h = N - 1, target = -nums[i];
            while (l < h) {
                int sum = nums[l] + nums[h];
                if (sum == target) {
                    cnt++;
                    l++;
                    h--;
                } else if (sum < target) {
                    l++;
                } else {
                    h--;
                }
            }
        }
        return cnt;
    }
}

倍率实验

如果 T(N) ~ aN^blogN，那么 T(2N)/T(N) ~ 2^b。

例如对于暴力的 ThreeSum 算法，近似时间为 ~N³/6。进行如下实验：多次运行该算法，每次取的 N 值为前一次的两倍，统计每次执行的时间，并统计本次运行时间与前一次运行时间的比值，得到如下结果：

N	Time(ms)	Ratio
500	48	/
1000	320	6.7
2000	555	1.7
4000	4105	7.4
8000	33575	8.2
16000	268909	8.0

可以看到，T(2N)/T(N) ~ 2³，因此可以确定 T(N) ~ aN³logN。

public class RatioTest {

    public static void main(String[] args) {
        int N = 500;
        int loopTimes = 7;
        double preTime = -1;
        while (loopTimes-- > 0) {
            int[] nums = new int[N];
            StopWatch.start();
            ThreeSum threeSum = new ThreeSumSlow();
            int cnt = threeSum.count(nums);
            System.out.println(cnt);
            double elapsedTime = StopWatch.elapsedTime();
            double ratio = preTime == -1 ? 0 : elapsedTime / preTime;
            System.out.println(N + "  " + elapsedTime + "  " + ratio);
            preTime = elapsedTime;
            N *= 2;
        }
    }
}

public class StopWatch {

    private static long start;


    public static void start() {
        start = System.currentTimeMillis();
    }


    public static double elapsedTime() {
        long now = System.currentTimeMillis();
        return (now - start) / 1000.0;
    }
}

补充

我们知道，对数之间是可以互相转换的，log n 就等于 log 2 * log n，所以 O(log n) = O(C * log n)，其中 C=log 2 是一个常量。基于我们前面的一个理论：在采用大 O 标记复杂度的时候，可以忽略系数，即 O(Cf(n)) = O(f(n))。所以，O(log n) 就等于 O(log n)。因此，在对数阶时间复杂度的表示方法里，我们忽略对数的“底”，统一表示为 O(logn)。

相关标签：数据结构与算法算法数据结构面试

上一篇： PHP 上传图片精简版

下一篇： [模板]PAM

算法分析

数学模型

1. 近似

2. 增长数量级

3. 内循环

4. 成本模型

注意事项

1. 大常数

2. 缓存

3. 对最坏情况下的性能的保证

4. 随机化算法

5. 均摊分析

ThreeSum

1. ThreeSumSlow

2. ThreeSumBinarySearch

3. ThreeSumTwoPointer

倍率实验

补充

CodeIgniter辅助之第三方类库third_party用法分析_php实例

对于ThinkPHP框架早期版本的一个SQL注入漏洞详细分析_PHP

PHP 数据结构算法描述冒泡排序 bubble sort

原生仿写Jquery代码分析

Node.js assert断言原理与用法分析

LinkedHashMap 核心源码分析

Pandora Bootstrap源码分析

Mybatis核心源码分析

PHP版本常用的排序算法汇总_php实例

Netty源码分析之核心线程处理

算法分析

数学模型

1. 近似

2. 增长数量级

3. 内循环

4. 成本模型

注意事项

1. 大常数

2. 缓存

3. 对最坏情况下的性能的保证

4. 随机化算法

5. 均摊分析

ThreeSum

1. ThreeSumSlow

2. ThreeSumBinarySearch

3. ThreeSumTwoPointer

倍率实验

补充

CodeIgniter辅助之第三方类库third_party用法分析_php实例

对于ThinkPHP框架早期版本的一个SQL注入漏洞详细分析_PHP

PHP 数据结构 算法描述 冒泡排序 bubble sort

原生仿写Jquery代码分析

Node.js assert断言原理与用法分析

LinkedHashMap 核心源码分析

Pandora Bootstrap源码分析

Mybatis核心源码分析

PHP版本常用的排序算法汇总_php实例

Netty源码分析之核心线程处理

PHP 数据结构算法描述冒泡排序 bubble sort