【OpenCV】【python】车道线定位及拟合(np.ployfit,cv2.fillPoly)
API使用流程
通过鸟瞰图计算直方图→用移动滑窗计算满足阈值个数的像素点→输出拟合曲线
参考文章
代码思路
1.创建二值像素直方图,把左边和右边数据分开,统计累计值最多的点坐标为中心。
2.设置一个宽度margin(窗口宽度一半),设置Y方向的滑动窗口个数(Y方向被切分成几份)
3.设置像素点阈值,如果超过阈值,则保留全部像素点坐标,最后得到一个全部符合的像素点坐标list。
4.使用np.ployfit最小二乘法拟合,计算出曲线的系数,这里使用二次曲线拟合。
5.使用cv2.fillPoly填充曲线内部的面积。
完整代码
# -*- coding:utf-8 -*-
'''
@Author: knocky
@Blog: https://blog.csdn.net/zzx188891020
@E-mail: 188891020@qq.com
@File: cal_line_param.py
@CreateTime: 2020/6/11 15:55
'''
import numpy as np
import cv2
import matplotlib.pyplot as plt
from perspect_transform import *
# 精确定位车道线
def cal_line_param(binary_warped):
# 1.确定左右车道线的位置
# 统计直方图
histogram = np.sum(binary_warped[:, :], axis=0) #histogram.shape (1280, )
# plt.plot(histogram)
# plt.show()
# 在统计结果中找到左右最大的点的位置,作为左右车道检测的开始点
# 将统计结果一分为二,划分为左右两个部分,分别定位峰值位置,即为两条车道的搜索位置
midpoint = np.int(histogram.shape[0] / 2)
leftx_base = np.argmax(histogram[:midpoint])
rightx_base = np.argmax(histogram[midpoint:]) + midpoint
# 2.滑动窗口检测车道线
# 设置滑动窗口的数量,计算每一个窗口的高度
nwindows = 9
window_height = np.int(binary_warped.shape[0] / nwindows)
# 获取图像中不为0的点
# nonzero函数是numpy中用于得到数组array中非零元素的位置(数组索引)的函数
# nonzero解释参见https://blog.csdn.net/lilong117194/article/details/78283358
nonzero = binary_warped.nonzero()
nonzeroy = np.array(nonzero[0])
nonzerox = np.array(nonzero[1])
# 车道检测的当前位置
leftx_current = leftx_base
rightx_current = rightx_base
# 设置x的检测范围,滑动窗口的宽度的一半,手动指定
margin = 100
# 设置最小像素点,阈值用于统计滑动窗口区域内的非零像素个数,小于50的窗口不对x的中心值进行更新
minpix = 50
# 用来记录搜索窗口中非零点在nonzeroy和nonzerox中的索引
left_lane_inds = []
right_lane_inds = []
# 遍历该副图像中的每一个窗口
for window in range(nwindows):
# 设置窗口的y的检测范围,因为图像是(行列),shape[0]表示y方向的结果,上面是0
win_y_low = binary_warped.shape[0] - (window + 1) * window_height
win_y_high = binary_warped.shape[0] - window * window_height
# 左车道x的范围
win_xleft_low = leftx_current - margin
win_xleft_high = leftx_current + margin
# 右车道x的范围
win_xright_low = rightx_current - margin
win_xright_high = rightx_current + margin
# 确定非零点的位置x,y是否在搜索窗口中,将在搜索窗口内的x,y的索引存入left_lane_inds和right_lane_inds中
good_left_inds = ((nonzeroy >= win_y_low) & (nonzeroy < win_y_high) &
(nonzerox >= win_xleft_low) & (nonzerox < win_xleft_high)).nonzero()[0]
good_right_inds = ((nonzeroy >= win_y_low) & (nonzeroy < win_y_high) &
(nonzerox >= win_xright_low) & (nonzerox < win_xright_high)).nonzero()[0]
left_lane_inds.append(good_left_inds)
right_lane_inds.append(good_right_inds)
# 如果获取的点的个数大于最小个数,则利用其更新滑动窗口在x轴的位置
if len(good_left_inds) > minpix:
leftx_current = np.int(np.mean(nonzerox[good_left_inds]))
if len(good_right_inds) > minpix:
rightx_current = np.int(np.mean(nonzerox[good_right_inds]))
# 将检测出的左右车道点转换为array
left_lane_inds = np.concatenate(left_lane_inds)
right_lane_inds = np.concatenate(right_lane_inds)
# 获取检测出的左右车道点在图像中的位置
leftx = nonzerox[left_lane_inds]
lefty = nonzeroy[left_lane_inds]
rightx = nonzerox[right_lane_inds]
righty = nonzeroy[right_lane_inds]
# 3.用曲线拟合检测出的点,二次多项式拟合,返回的结果是系数
left_fit = np.polyfit(lefty, leftx, 2)
right_fit = np.polyfit(righty, rightx, 2)
return left_fit, right_fit
# 填充车道线之间的多边形
def fill_lane_poly(img, left_fit, right_fit):
# 获取图像的行数
y_max = img.shape[0]
# 设置输出图像的大小,并将白色位置设为255
out_img = np.dstack((img, img, img)) * 255
# 在拟合曲线中获取左右车道线的像素位置
left_points = [[left_fit[0] * y ** 2 + left_fit[1] * y + left_fit[2], y] for y in range(y_max)]
right_points = [[right_fit[0] * y ** 2 + right_fit[1] * y + right_fit[2], y] for y in range(y_max - 1, -1, -1)]
# 将左右车道的像素点进行合并
line_points = np.vstack((left_points, right_points))
# 根据左右车道线的像素位置绘制多边形
cv2.fillPoly(out_img, np.int_([line_points]), (0, 255, 0))
return out_img
if __name__ == '__main__':
img_transform = cv2.imread('perspect_img/img_straight_transform.jpg',0)
# 这里的点,是之前直线确认好的点。不是test3的标定点
points = [[601, 448], [683, 448], [230, 717], [1097, 717]]
# 计算透视变化矩阵
M, M_inverse = cal_perspective_params(img_transform, points)
# trasform_img = img_perspect_transform(img_transform, M)
# 拟合左右车道线
left_fit, right_fit = cal_line_param(img_transform)
result = fill_lane_poly(img_transform, left_fit, right_fit)
cv2.imshow('result',result)
cv2.waitKey(0)
img_transform = img_perspect_transform(result, M_inverse)
cv2.imshow('img_transform', img_transform)
cv2.waitKey(0)
#彩色图片效果融合
img = cv2.imread('../test/straight_lines2.jpg')
img_transform_RGB = cv2.addWeighted(img,1,img_transform,0.5,0)
cv2.imshow('img_transform_RGB', img_transform_RGB)
cv2.waitKey(0)
遇到的问题
查看问题点:
导入的图片显示的是黑白的,但是保存以后居然是RGB三通道,看来是设置问题了。这里正确的应该是(1280,)
调试代码时遇到的坑:
用cv2.imread读取灰度图,发现获得的图片为3通道,经查证发现,cv2.imread()函数默认读取的是一副彩色图片,想要读取灰度图,则需要设置参数。
使用函数cv2.imread(filepath,flags)读入一副图片
filepath:要读入图片的完整路径
flags:读入图片的标志
cv2.IMREAD_COLOR:默认参数,读入一副彩色图片,忽略alpha通道
cv2.IMREAD_GRAYSCALE:读入灰度图片
cv2.IMREAD_UNCHANGED:顾名思义,读入完整图片,包括alpha通道
img = cv2.imread(‘color_binary.jpg’,0) 这里写0,读取的就是灰度,不写就是彩色。
出现了这个问题
最后发现是由于打散源代码的时候,为了输出效果,乘以了255,然后代码里又乘以了255
#将这个代码的255去掉即可
out_img = np.dstack((img, img, img)) * 255
#这样就行了
out_img = np.dstack((img, img, img))
效果展示
统计0-1280宽度方向的,每一个像素列的像素值统计分布,效果一目了然
换了另一个图的效果
拟合效果
填充以后的效果
逆转换效果:
图像融合效果:
本文地址:https://blog.csdn.net/zzx188891020/article/details/106690655