在HTML5 canvas里用卷积核进行图像处理的方法
卷积什么是卷积?
就跳过一些用专业属于描述专业术语看完懵逼的解释了,
语文成绩很差的我尝试从字面解释什么是卷积...
卷,理解成一种压缩;积,乘积,积累;
卷积需要一个卷积核,通常是3x3或5x5的方阵,
例如这样
// 一个3x3卷积核
0 0 0
0 1 0
0 0 0
我们要怎么用卷积核处理数据呢?
下面是一个例子:
// 下面是一堆排成方阵的数据
// 这是我们的数据源
1 3 5 1 3 5 1 3 5
4 5 6 1 3 5 1 3 5
4 5 6 1 3 5 1 3 5
4 5 6 1 3 5 1 3 5
我们将要用卷积核“扫描并处理”每一个数据,
例如要处理第二行第二列的5
1 3 5 0 0 0
4 5 6 * 0 1 0
4 5 6 0 0 0
我们把5
周围的数字抽出来,然后把两个方阵位置相同的数字相乘然后相加,
得出5
,这是当然的,因为这个卷积核做的就是输出原数据????
-1 -1 -1
-1 8 -1
-1 -1 -1
同样的原理,试试另一个不同的卷积核
1 3 5 -1 -1 -1
4 5 6 * -1 8 -1
4 5 6 -1 -1 -1
我们得到的是
1*-1 + 3*-1 + 5*-1
+ 4*-1 + 5*8 + 6*-1
+ 4*-1 + 5*-1 + 6*-1
= 6
然后用得出来的6
放入原来5
的位置,就是这样“扫描并处理”每一个数据
边缘怎么办?
- 常数填充
- 复制边缘像素
突然的深度拓展
卷积在深度学习中十分重要,下面是一个可视化cnn(卷积神经网络)的卷积过程
canvas
<canvas>是一个可以使用脚本(通常为javascript)来绘制图形的 html 元素.它可以用于绘制图表、制作图片构图或者制作简单的(以及不那么简单的)动画。
canvas 绘制图片
ctx.drawimage(image, x, y)
canvas 转换为 imagedata
ctx.getimagedata(sx, sy, sw, sh); // 返回 imagedata
imagedata 数据是 uint8clampedarray
,它描述了一个一维数组,包含以 rgba 顺序的数据,数据使用 0 至 255(包含)的整数表示。
所以每一个点都会表示为:
// 这样仅仅是一个像素点的数据
r g b a
255 255 0 255
卷积 + imagedata = ?
图像归根到底就是一大堆的颜色点矩阵,我们完全可以把颜色点代替上面的数字矩阵处理,不同的卷积核对图片的处理结果如下(图片来自*)
卷积就是如此神奇????
在 canvas 中实现卷积处理
以下是一个 javascript 对 canvas 输出的 imagedata 进行卷积的实例:
/* * 参数中的 kernel 就是卷积核方阵,不过顺着排列成了一个九位的数组 * 像是这样 [-1, -1, -1, -1, 8, -1, -1, -1, -1] * offset 对rgba数值直接增加,表现为提高亮度 * 下面的for循环 * y 代表行,x 代表列,c 代表rgba */ convolutionmatrix(input, kernel, offset = 0) { let ctx = this.outputctx let output = ctx.createimagedata(input) let w = input.width, h = input.height let id = input.data, od = output.data for (let y = 1; y < h - 1; y += 1) { for (let x = 1; x < w - 1; x += 1) { for (let c = 0; c < 3; c += 1) { let i = (y * w + x) * 4 + c od[i] = offset + (kernel[0] * id[i - w * 4 - 4] + kernel[1] * id[i - w * 4] + kernel[2] * id[i - w * 4 + 4] + kernel[3] * id[i - 4] + kernel[4] * id[i] + kernel[5] * id[i + 4] + kernel[6] * id[i + w * 4 - 4] + kernel[7] * id[i + w * 4] + kernel[8] * id[i + w * 4 + 4]) / this.divisor } od[(y * w + x) * 4 + 3] = 255 } } ctx.putimagedata(output, 0, 0) }
成品代码:
测试网址,附带彩蛋嘻嘻嘻????
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。