Java实现矩阵乘法以及优化的方法实例
传统的矩阵乘法实现
首先,两个矩阵能够相乘,必须满足一个前提:前一个矩阵的行数等于后一个矩阵的列数。
第一个矩阵的第m行和第二个矩阵的第n列的乘积和即为乘积矩阵第m行第n列的值,可用如下图像表示这个过程。
矩阵乘法过程展示
c[1][1] = a[1][0] * b[0][1] + a[1][1] * b[1][1] + a[1][2] * b[2][1] + a[1][3] * b[3][1] + a[1][4] * b[4][1]
而用java实现该过程的传统方法就是按照该规则实现一个三重循环,把各项乘积累加:
public int[][] multiply(int[][] mat1, int[][] mat2){ int m = mat1.length, n = mat2[0].length; int[][] mat = new int[m][n]; for(int i = 0; i < m; i++){ for(int j = 0; j < n; j++){ for(int k = 0; k < mat1[0].length; k++){ mat[i][j] += mat1[i][k] * mat2[k][j]; } } } return mat; }
可以看出该方法的时间复杂度为o(n3),当矩阵维数比较大的时候程序就很容易超时。
优化方法(strassen算法)
strassen算法是由volker strassen在1966年提出的第一个时间复杂度低于o(n³)的矩阵乘法算法,其主要思想是通过分治来实现矩阵乘法的快速运算,计算过程如图所示:
将一次矩阵乘法拆分成多个乘法与加法的结合
为什么这个方法会更快呢,我们知道,按照传统的矩阵乘法:
c11 = a11 * b11 + a12 * b21
c12 = a11 * b12 + a12 * b22
c21 = a21 * b11 + a22 * b21
c22 = a21 * b12 + a22 * b22
我们需要8次矩阵乘法和4次矩阵加法,正是这8次乘法最耗时;而strassen方法只需要7次矩阵乘法,尽管代价是矩阵加法次数变为18次,但是基于数量级考虑,18次加法仍然快于1次乘法。
当然,strassen算法的代码实现也比传统算法复杂许多,这里附上另一个大神写的java实现(原文链接:):
public class matrix { private final matrix[] _matrixarray; private final int n; private int element; public matrix(int n) { this.n = n; if (n != 1) { this._matrixarray = new matrix[4]; for (int i = 0; i < 4; i++) { this._matrixarray[i] = new matrix(n / 2); } } else { this._matrixarray = null; } } private matrix(int n, boolean needinit) { this.n = n; if (n != 1) { this._matrixarray = new matrix[4]; } else { this._matrixarray = null; } } public void set(int i, int j, int a) { if (n == 1) { element = a; } else { int size = n / 2; this._matrixarray[(i / size) * 2 + (j / size)].set(i % size, j % size, a); } } public matrix multi(matrix m) { matrix result = null; if (n == 1) { result = new matrix(1); result.set(0, 0, (element * m.element)); } else { result = new matrix(n, false); result._matrixarray[0] = p5(m).add(p4(m)).minus(p2(m)).add(p6(m)); result._matrixarray[1] = p1(m).add(p2(m)); result._matrixarray[2] = p3(m).add(p4(m)); result._matrixarray[3] = p5(m).add(p1(m)).minus(p3(m)).minus(p7(m)); } return result; } public matrix add(matrix m) { matrix result = null; if (n == 1) { result = new matrix(1); result.set(0, 0, (element + m.element)); } else { result = new matrix(n, false); result._matrixarray[0] = this._matrixarray[0].add(m._matrixarray[0]); result._matrixarray[1] = this._matrixarray[1].add(m._matrixarray[1]); result._matrixarray[2] = this._matrixarray[2].add(m._matrixarray[2]); result._matrixarray[3] = this._matrixarray[3].add(m._matrixarray[3]);; } return result; } public matrix minus(matrix m) { matrix result = null; if (n == 1) { result = new matrix(1); result.set(0, 0, (element - m.element)); } else { result = new matrix(n, false); result._matrixarray[0] = this._matrixarray[0].minus(m._matrixarray[0]); result._matrixarray[1] = this._matrixarray[1].minus(m._matrixarray[1]); result._matrixarray[2] = this._matrixarray[2].minus(m._matrixarray[2]); result._matrixarray[3] = this._matrixarray[3].minus(m._matrixarray[3]);; } return result; } protected matrix p1(matrix m) { return _matrixarray[0].multi(m._matrixarray[1]).minus(_matrixarray[0].multi(m._matrixarray[3])); } protected matrix p2(matrix m) { return _matrixarray[0].multi(m._matrixarray[3]).add(_matrixarray[1].multi(m._matrixarray[3])); } protected matrix p3(matrix m) { return _matrixarray[2].multi(m._matrixarray[0]).add(_matrixarray[3].multi(m._matrixarray[0])); } protected matrix p4(matrix m) { return _matrixarray[3].multi(m._matrixarray[2]).minus(_matrixarray[3].multi(m._matrixarray[0])); } protected matrix p5(matrix m) { return (_matrixarray[0].add(_matrixarray[3])).multi(m._matrixarray[0].add(m._matrixarray[3])); } protected matrix p6(matrix m) { return (_matrixarray[1].minus(_matrixarray[3])).multi(m._matrixarray[2].add(m._matrixarray[3])); } protected matrix p7(matrix m) { return (_matrixarray[0].minus(_matrixarray[2])).multi(m._matrixarray[0].add(m._matrixarray[1])); } public int get(int i, int j) { if (n == 1) { return element; } else { int size = n / 2; return this._matrixarray[(i / size) * 2 + (j / size)].get(i % size, j % size); } } public void display() { for (int i = 0; i < n; i++) { for (int j = 0; j < n; j++) { system.out.print(get(i, j)); system.out.print(" "); } system.out.println(); } } public static void main(string[] args) { matrix m = new matrix(2); matrix n = new matrix(2); m.set(0, 0, 1); m.set(0, 1, 3); m.set(1, 0, 5); m.set(1, 1, 7); n.set(0, 0, 8); n.set(0, 1, 4); n.set(1, 0, 6); n.set(1, 1, 2); matrix res = m.multi(n); res.display(); } }
总结
到此这篇关于java实现矩阵乘法以及优化的文章就介绍到这了,更多相关java矩阵乘法及优化内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持!