摘要
针对国内外缺乏高速公路病害的数据样本问题,该文建立了包含高速公路2D图像和3D形貌的病害数据集,并对数据采集原理、数据处理方法、样本描述、数据质量控制与验证进行了详细阐述。该数据集包含不同车道、不同光线背景、不同道路结构共计576个细分场景下的龟裂、块状裂缝、纵向裂缝、横向裂缝、沉陷、车辙、波浪拥包、坑槽等11类高速公路路面病害;警告标志、禁令标志、指示标志、指路标志、旅游区标志、道路施工安全标志6类交通标志。该数据集不仅可以为各类高速公路缺陷检测神经网络模型提供庞大的训练样本,还可以借助该数据集对YOLOV7模型进行小样本训练,验证数据集的有效性。研究结果表明:通过建立基于高速公路场景的图像数据集,能够有效深化对高速公路病害和路面场景的理解,为解决高速公路路面病害检测问题提供了智能信息化的解决方案,并为相关算法模型的训练和后续数据集建设工作奠定了坚实基础。
0 引言
截至2022年底,中国公路总里程达到528.07万km,其中公路养护里程为525.16万km,占公路总里程的99.4%。高速公路作为中国公路交通系统的重要组成部分,场景复杂,病害种类繁多,一旦发生交通事故则容易引发重大损失。因此,在实际养护工作中,存在病害检测难度大、识别精度要求高等问题。
针对高速公路病害检测问题,自20世纪90年代起,基于传统图像处理算法的道路检测模型就受到国内外学者的广泛关注。但高速道路病害繁多,同一种病害可能呈现不同的形态特征,导致在识别过程中鲁棒性不
当前国外开源数据集主要为沥青路面典型病害样本数据集(China Road Damage Detection,CNRDD),该数据集包含捷克、印度、日本3个国家街区道路病害,其样本角度、拍摄设备均无法适用于高速公路病害检测。而中国并没有系统的公路病害数据集,也没有具体病害样本分类,同时大多数据集没有采集3D数据,仅使用2D图像进行对
为了解决高速公路场景测量范围大的问题,提出一种多相机以及平面镜扩大视场的线结构光测量方法,同时采集2D和3D数据,并对其进行定位匹配。通过对公路路面重构后作进一步检测,获得更广泛的深度信
采集原理是通过相机成像以及线结构光成像来实现二维图像与三维点云的完全匹
1 线结构光3D图像数据采集原理
1.1 基于平面镜的扩大相机市场线标定
在公路路面三维形貌测量中,路面宽度所需的相机大视场是很难通过广角相机实现精准测量的。常用的单目测量系统在大视场高精度测量中存在局限性;而普通的双目相机测量系统则依赖重叠视场在复杂环境下无法实现准确标定,导致实际测量精度不高。为满足大视场高精度测量的需求,先要解决无重叠视场的相机标定问题,再根据现实需求,提出一种基于平面镜的无重叠视场相机的标定方法。
平面镜是一种具有光滑、平坦、反射面的镜子。当阳光或光线照射到物体表面经过漫反射后,光线从物体表面反射到镜子上,再由镜子将光线反射至人眼,则可从镜子里看到一个虚拟影像。由于成像的特点,物体和虚拟图像大小相同,并相隔距离相同。光线被平面镜反射后,其连续线的交点形成物体的虚拟图像。
(1) |
式中:为的齐次坐标;为的齐次坐标,单位为pixel;为尺度因子;为摄像机的内参矩阵;I为3×3的单位矩阵;为相机坐标系到世界坐标系的齐次变换矩阵,由旋转矩阵与平移向量组成,可表示为
(2) |
(3) |
式中:,,则:
(4) |
即平面镜反射矩阵为正交对称矩阵,。

图1 平面镜反射透视投影模型
Figure 1 Model of perspective projection by plane mirror reflection
分析三维点和在相机和虚拟相机中透视投影之间的关系,为后续建立数学模型提供条件约束。如
(5) |
即点X在虚拟摄像机的透视投影与虚拟像点在摄像机中的投影一致。
1.2 平面镜的无重叠视场的线结构光测量原理
相机标定完成能够得到相机坐标系与靶标坐标系的关系:
(6) |
式中:和分别为对应待测物在第n个空间位置的旋转矩阵和平移向量。其目标可以自由移动几次,以获得摄像机坐标系中的几个特征点。然后可以通过最小二乘法调整光平面。线性结构的光平面方程如下:
(7) |
利用最小二乘平面拟合将得到的点集求得光平面方程的参数,再推导最小二乘平面拟合的公式。光平面方程对应的误差方程如下:
(8) |
取误差方程的偏导数:
(9) |
(10) |
(11) |
这些偏导数公式可以简化为:
(12) |
(13) |
(14) |
求解流程如下:
(15) |
(16) |
(17) |
(18) |
最终得到平面方程的系数为:
(19) |
照相机坐标系中的光平面被指定如下:
= | (20) |
优化函数被定义为物体特征点与光平面的欧几里距离的平方之和:
(21) |
式中:。
/ | (22) |
令所得的多个校准参考点被用于方程(22)中,得到一组多个非线性方程,然后对其进行非线性优化,可以得到光平面的方程最优解。
2 数据采集与处理方法
2.1 试验车辆设计
数据集主要是通过公路采集车采集。在试验车辆上安装摄像机、激光器、5G卡、RTK定位模块、车载工控机、车载支架等设备。其中,摄像机通过支架固定在车辆顶部,并与工控机通过网线连接;摄像机及工控机由车辆蓄电池供电,主要设备应保持良好的散热环境,同时应尽量避免雨淋,如摄像机等无法避免的设备应具备较强的防水能力;5G卡安装在工控机上,使其具备联网能力;通信模块在高速公路等野外环境下应保证通信稳定。
2.2 2D和3D数据采集
2D图像数据集主要来源于互联网数据、众包采集数据、行业合作数据以及各种传感器数据,而3D图像数据集为互联网数据和传感器数据。其中,互联网数据主要是通过数据爬虫和网页解析来实现,需要针对特定主题和垂直领域开发大规模分布式抓取和实时解析模块;众包采集数据是以数据支撑平台为基准,集全社会力量进行采集的,并对数据进行噪声、错误、遗漏的发现和纠正;行业合作数据主要是针对拥有庞大和高质量数据资源的行业企业和机构,通过数据链接以及人工智能大数据服务平台对数据进行清洗、处理,然后在企业混合云平台中对数据自测进行管理和审核,最后将数据用于人工智能应用;传感器数据是根据要采集的数据类型及特点开发采集系统直接接收传感器信号来作为数据源。
本系统主要使用互联网数据采集和传感器采集两种方式。前期通过互联网获取公开数据集作为初始样本,后期主要通过摄像头采集实际道路中的数据。在实际道路数据采集中,同时采集2D数据和3D数据,并且将2D图像与3D形貌根据定位系统一一对应,通过5G传输技术将数据整理并上传到云服务器。其中,三维重构后的形貌点云数据需要通过精度评价后才能与二维图像完全匹配。目前,线结构光平面的测量精度评价还没有具体的国际标准,因此采用光平面标定的直接评价指标——平面拟合精度进行精度评价。基于交叉比不变性计算的特征点,其三维坐标比较准确。因此,以交叉比不变性法的结果为标准,评价标定方法的精度,并将棋盘平面目标依次放置在左右线结构光视觉传感器前方,线激光与棋盘之间的水平交点坐标称为测试点,利用交叉比不变性得到测试点的三维坐标,通过比较不同方法获得的两组测试点的三维坐标来评价传感器的校准精度,结果如

(a) 左线结构光视觉传感器

(b) 右线结构光视觉传感器
图2 控制点三维坐标标定精度评估
Figure 2 Evaluation of calibration accuracy of 3D coordinates of control points
2.3 数据处理
通过人工智能手段对原始数据进行预筛选。首先,对互联网公开数据集进行校验,完成初始模型训练,再开发数据预处理系统完成对原始数据的筛选,并通过标定的部分小样本进行迭代,直至两次模型处理结果相差甚微。针对3D重建则需要做进一步的数据处理,以降低图像噪声对3D重建精度的影响。
图像噪声是指图像在接收或传输过程中经历的随机信号干扰,其表现为图像信息或像素亮度的随机变化。其中,高斯噪声在噪声图像的统计直方图中呈正态分布,其对原始图像具有随机影响,是一种特别常见的噪声类型。为了研究图像噪声对光平面校准的具体影响,对图像施加高斯噪声,将0.1~0.9 pixel的标准偏差应用于光谱特征点,并与没有噪声的校准结果进行比较。
针对每个噪声水平的图像,分别计算出所对应的光平面参数a、b、c,再计算这些参数与未加噪声的相对误差。其中,光平面参数a、b、c的相对误差随噪声水平增加而变化的结果如

(a) 右侧光平面参数结果

(b) 左侧光平面参数结果
图3 不同噪声强度下标定参数的相对误差
Figure 3 Relative error of calibration parameters under different noise intensities
从
3 数据样本描述
本次采集范围应尽可能覆盖广泛的高速公路场景,采集的道路范围包含两车道、三车道、四车道;每种类型包含普通道路、桥梁、隧道、匝道等部位;道路年限覆盖5年内、5年到10年、10年至20年、20年以上几种类型;时间范围覆盖清晨、日间、傍晚;季节范围覆盖春、夏、秋、冬,共计576个细分场景。每个场景至少包含100 km里程,累计里程近6万km,时间跨度1年。预计采集视频时长为600 h,图片数量近5 000万张。
鉴于道路病害的尺寸通常较小,人眼发现较为困难,因此先对图像进行预标定,再进行人工校验及审核,这是提高标定效率、节省人力成本的有效方法。同时为保障最终标定质量,制定了以下要求:
(1) 标定目标。本次需标定的目标类别包含:龟裂、块状裂缝、纵向裂缝、横向裂缝、沉陷、车辙、波浪拥包、坑槽等道路病害,以及标识牌等设施。
(2) 标注工具。因本次标注数据较多,需要协同的人员较多,且涉及矩形框目标标注及图像语义分割两部分,拟租用山东高速信息集团现有标注平台进行标注。
(3) 导出数据格式为VOC、COCO、YOLO等数据格式。
(4) 标注框规范。确保矩形方框包含了目标的轮廓信息,且矩形框不能偏离目标,边缘应紧贴目标边缘,边界误差尽可能小。
(5) 标注范围。在标注过程中,不仅要标注图像中完整的目标,当目标发生遮挡时,还需根据人眼可视范围标注出目标未遮挡部分轮廓,以增强模型的鲁棒性。
(6) 标注尺度。以人眼分辨能力为基准,标注出图像中存在的所有目标,小目标不能遗漏。
(7) 标注方法。以深度学习的目标检测算法为核心,结合语义信息和图像进行匹配映射,构建一个高速公路目标检测网络模型。
本次数据集的标注采用小容量样本到大容量的逐步扩展方式,从而实现对图像的整体标注。数据标注流程如

图4 数据标注流程图
Figure 4 Data annotation flowchart
目标检测的算法主要分为两类:① R-CNN系算法,其主要思路是先通过启发式方法(selective search)或者CNN网络(RPN)生成一系列稀疏的候选框,然后对这些候选框进行分类与回归;② Yolo类型的算法,其主要思路为:在图片的不同位置进行密集、均匀地抽样,抽样时采用不同尺度和长宽比,然后利用CNN提取特征后直接进行分类与回归,整个过程仅需一步。为了满足标注的准确性要求,选择Yolo算法作为基底算法,并将其改造为通过语义辅助的半监督算法。
YoloV7为目标检测领域热门网络之一,由主干网络(Backbone)、颈部网络(neck)和预测头(head)3部分构成。主干网络由卷积(BConv)、ELAN层和MPConv层3部分组成,负责主干特征的提取,将输入图片的信息转换为特征层。颈部网络用于加强特征提取,将主干部分获得的有效特征层进行特征融合,特征融合的目的是结合不同尺度的特征信息。预测头为YoloV7的分类器与回归器,可判断特征点上的先验框是否有物体与其对应。整个YoloV7网络所做的工作流程就是特征提取—特征加强—预测先验框对应的物体情况。其网络结构如

图5 YoloV7的具体结构
Figure 5 Specific structure of YoloV7
本次选用的数据集为本文构建的高速路面形貌病害数据集。该数据集涵盖了不同的高速公路场景,以及普通道路、桥梁、隧道、匝道等场景。在数据集标注过程中,将道路病害按照相应的种类,划分为crack(裂缝)、pothole(坑洞)、patch(修补区域)3个类别。并以6∶2∶2的比例划分为训练集、验证集、测试集。其中,训练集包含300张图像,验证集和测试集各包含100张图像。
本文试验环境如
CPU | GPU | RAM | Framwork |
---|---|---|---|
Intel Core i5‑11400H | RTX3060 | 16 G | Pytorch 1.9 |
试验过程的损失下降如

图6 损失函数曲线
Figure 6 Loss function curve
模型训练完成后,在测试集中对模型进行验证,以测试模型识别图片中路面的形貌病害的能力,并以预测框的形式标注出模型检测结果,如

(a) 裂纹标注结果图

(b) 裂纹标注结果图

(c) 裂纹、补丁标注结果图

(d) 坑洼标注结果图
图7 裂纹、坑洼和指示牌的标注结果图
Figure 7 Labeling results of cracks, potholes, and signposts
在YoloV7的基础上,通过将语义信息与图像特征形成映射,将目标检测改为短语关联,将检测和关联统一起来。这种重新表述改变了检测模型的输入,它不仅将图像作为输入,还将描述检测任务中所有候选类别的文本提示作为输入。这种方法实现了将零样本迁移到新的图像分布和任务中,并利用语义输入作为提示工程的一部分。
目前,提出的网络仅训练了3种语义信息,但随着未来研究的进一步深入,之前提出的所有种类信息都将被纳入标注和训练范畴。
4 数据质量控制与验证
校验所有标注结果,并将错标、漏标等数据重新标注,然后保存上述图像作为后续的验证集。数据集的采集是一个系统工程,其整体架构如

图8 数据采集整体架构图
Figure 8 Overall architecture of data collection
划分数据集的缺陷类型数据,其结果如

(a) 定检识别的纵向裂纹

(b) 定检识别的横向裂纹

(c) 定检识别的块修

(d) 定检识别的条修
图9 道路数据缺陷样式图
Figure 9 Road data defect styles
应用层中的数据预处理系统主要为算法的开发及算法结果的处理,其中,数据预筛选模块可以从海量视频中筛选出包含有效信息的图像,预标定模块可以对预筛选产生的图片进行预标定,生成标定数据。该系统预计可节省60%的筛选工作量及40%的标定工作量,本系统处理过的数据再经人工审核校验后即为合格的数据集样本。本系统主要为后台算法部分,将部署在GPU服务器上。应用层的数据管理系统主要为最终样本数据的管理,包括数据上传、查询、展示及统计分析。例如:可统计样本的分布范围、各类目标的数量等信息。同时,数据集作为重要的数据资产,其使用及共享应严格控制与记录。
5 结语
为解决高速公路路面病害检测问题,确保高速公路沥青路面质量,并保障行车安全,该文基于高速公路场景,建立了图像训练集、验证集和测试集,以深化对高速公路病害和路面场景的理解,为采用智能信息化方式解决高速公路养护问题的初步尝试。该文提出构建一种高速公路专用数据集,并运用数据元提取方
参考文献
高建贞.基于图像分析的道路病害自动检测研究[D].南京:南京理工大学,2003. [百度学术]
GAO Jianzhen.Research on automatic pavement distress detection based on image analysis[D].Nanjing:Nanjing University of Science and Technology,2003. [百度学术]
刘宪明,辛公锋.国内基于深度学习的道路路面病害检测研究综述[J].电子世界,2021(8):96-98. [百度学术]
LIU Xianming,XIN Gongfeng.Summary of domestic research on pavement disease detection based on deep learning[J].Electronics World,2021(8):96-98. [百度学术]
刘宪明,夏晗,胡冬平,等.公路路面损坏与内部隐伏病害的关联性研究[J].中外公路,2024,44(5):75-82. [百度学术]
LIU Xianming,XIA Han,HU Dongping,et al.Correlation between pavement distress and structural hidden distress[J].Journal of China & Foreign Highway,2024,44(5):75-82. [百度学术]
田杨,邱玲.一种基于Fast-RCNN的道路病害检测算法[J].市政技术,2020,38(增刊1):123-127. [百度学术]
TIAN Yang,QIU Ling.A road disease detection algorithm based on Fast-RCNN[J].Journal of Municipal Technology,2020,38(sup 1):123-127. [百度学术]
ZHOU W,ZHAN Y F,ZHANG H C,et al.Road defect detection from on-board cameras with scarce and cross-domain data[J].Automation in Construction,2022,144:104628. [百度学术]
ZHU Z M,LI M C,ZHOU F Q,et al.Stable 3D measurement method for high dynamic range surfaces based on fringe projection profilometry[J].Optics and Lasers in Engineering,2023,166:107542. [百度学术]
ZHU Z M,DONG Y W,YOU D D,et al.Accurate three-dimensional measurement based on polarization-defocused encoded structured light[J].Measurement,2022,205:112128. [百度学术]
杨东霖.基于深度学习的离焦条纹投影三维测量方法研究[D].南京:南京理工大学,2021. [百度学术]
YANG Donglin.Research on 3D measurement method of defocused fringe projection based on deep learning[D].Nanjing:Nanjing University of Science and Technology,2021. [百度学术]
郑瑞卿.基于弱监督的单视图三维重构方法及应用研究[D].北京:北京交通大学,2020. [百度学术]
ZHENG Ruiqing.Research on single view 3D reconstruction based on weak supervision and its application[D].Beijing:Beijing Jiaotong University,2020. [百度学术]
ZHU Z M,DONG Y W,XIANG P,et al.Rapid exposure time estimation method for high-dynamic range surface[J].Optik, 2023,273:170467. [百度学术]
揭强,符锌砂.高速公路小间距互通立交连接段改造方案研究:以中江高速公路新隆枢纽‒港口互通为例[J/OL].中外公路,1-7[2024-11-28].https://kns.cnki.net/kcms/detail/43.1363.U.20241128.1521.006.html. [百度学术]
JIE Qiang,FU Xinsha.Study on reconstruction scheme of expressway small-spacing interchange connecting section: Taking Xinlong hub-port interchange of Zhongjiang Expressway as an example[J/OL].Journal of China & Foreign Highway,1-7[2024-11-28].https://kns.cnki.net/kcms/detail/43.1363.U.20241128.1521.006.html. [百度学术]
孙朝云,邹鹏,李伟,等.基于OpenGL路面裂缝三维重构技术研究[J].中外公路,2014,34(5):73-76. [百度学术]
SUN Zhaoyun,ZOU Peng,LI Wei,et al.Research on 3D reconstruction technology of pavement cracks based on OpenGL[J].Journal of China & Foreign Highway,2014,34(5):73-76. [百度学术]
郝雪丽,孙朝云,李伟,等.基于结构光的路面三维重构技术[J].计算机工程与设计,2015,36(8):2303-2307. [百度学术]
HAO Xueli,SUN Zhaoyun,LI Wei,et al.3D road reconstruction research based on structured light[J].Computer Engineering and Design,2015,36(8):2303-2307. [百度学术]
李智,刘健,苏冠宇.基于激光轮廓仪的沥青路面轮廓特征的三维重构技术[J].公路工程,2019,44(5):47-52. [百度学术]
LI Zhi,LIU Jian,SU Guanyu.Three-dimension reconstruction of asphalt pavement contour features based on laser profiler[J].Highway Engineering,2019,44(5):47-52. [百度学术]
黄中文,周飞,王元元.基于改进光度立体技术的路面三维纹理重构测量[J].公路,2022,67(1):14-18. [百度学术]
HUANG Zhongwen,ZHOU Fei,WANG Yuanyuan.Measurement of pavement 3D texture based on improved photometric stereo technique[J].Highway,2022,67(1):14-18. [百度学术]
WANG X Y,ZHU Z M,ZHOU F Q,et al.Complete calibration of a structured light stripe vision sensor through a single cylindrical target[J].Optics and Lasers in Engineering,2020,131:106096. [百度学术]
PAN J W,SHI Z S,MENG X,et al.Reflection characteristics of typical road defects in 3D GPR images for collapse mitigation[J].Journal of Applied Geophysics,2023,217:105166. [百度学术]
金红杰,钟岳,臧利国,等.基于三次样条插值谐波叠加技术的随机路面重构方法研究[J].振动与冲击,2023,42(10):23-30,143. [百度学术]
JIN Hongjie,ZHONG Yue,ZANG Liguo,et al.A study on harmonic superposition method based on cubic spline interpolation of random road reconstruction[J].Journal of Vibration and Shock,2023,42(10):23-30,143. [百度学术]
李晓霞,陈强.三维场景分割中多模态数据融合的2D-3D耦合网络[J].计算机时代,2023(1):17-20,25. [百度学术]
LI Xiaoxia,CHEN Qiang.A joint 2D-3D network based on multimodal data fusion for 3D scene semantic segmentation[J].Computer Era,2023(1):17-20,25. [百度学术]
曾永强,张永华,赵辉,等.高速路侧雷达和相机融合的目标检测与跟踪[J/OL].中外公路,1-8[2025-01-22].https://kns.cnki.net/kcms/detail/43.1363.U.20250122.1717.010.html. [百度学术]
ZENG Yongqiang,ZHANG Yonghua,ZHAO Hui,et al.Target detection and tracking based on high-speed roadside radar and camera fusion[J/OL].Journal of China & Foreign Highway,1-8[2025-01-22].https://kns.cnki.net/kcms/detail/43.1363.U.20250122.1717.010.html. [百度学术]
白宇,梁晓玉,安胜彪.深度学习的2D-3D融合深度补全综述[J].计算机工程与应用,2023,59(13):17-32. [百度学术]
BAI Yu,LIANG Xiaoyu,AN Shengbiao.Review of 2D-3D fusion deep completion of deep learning[J].Computer Engineering and Applications,2023,59(13):17-32. [百度学术]
杨凤满,孙玲,宋向辉,等.面向智慧高速公路数据管理需求的数据元提取方法[J].公路交通科技,2022,39(增刊1):116-122. [百度学术]
YANG Fengman,SUN Ling,SONG Xianghui,et al.Data element extraction method for data management requirements of smart expressway[J].Journal of Highway and Transportation Research and Development,2022,39(sup 1):116-122. [百度学术]