摘要
路面摩擦性能是公路安全的重要指标,它与路面纹理密切相关。针对不同噪声的路面纹理数据,该文提出了一套路面三维纹理数据去噪方法,该方法可以在去除噪声的同时保留纹理的局部特征。此外,该文还基于 Vision Trans- former 的设计理念,开发了 Friction-1D Transformer 抗滑预测模型,用于评估沥青路面的抗滑性能。与传统的卷积神经网络不同,Friction-1D Transformer 利用位置编码结构和多头注意力机制,能够从一维纹理信号中提取沿行车方向的全局特征,从而实现对路面摩擦性能的准确预测。与随机森林(RF)、k 近邻算法(k-NN)、深度残差网络(Resnet)和 Vision Transformer(VIT)共 4 种模型进行对比分析后发现,Friction-1D Transformer 具有更高的准确率和更快的训练速度,且其参数量仅为 3915914。该研究验证了直接使用原始纹理数据进行训练并进行抗滑预测的可行性,所使用的模型结构有望推动路面抗滑性能测试技术的进一步发展。
Abstract
The friction performance of road surfaces is an important indicator of highway safety, which is closely related to road texture. In this paper, a set of three-dimensional denoising methods for road texture data with different noise levels was proposed, which could effectively remove noise while preserving local texture features. In addition, a skid resistance prediction model named Friction-1D Transformer was developed based on the design concept of Vision Transformer (VIT) for skid resistance evaluation of asphalt pavements. Unlike traditional convolutional neural networks, the Friction-1D Transformer utilized positional encoding structures and multi-head attention mechanisms to extract global features from one-dimensional (1D) texture signals along the direction of vehicle movement, thus accurately predicting the friction performance of road surfaces. Comparative analysis with four other models, namely random forest (RF),k-nearest neighbor (k-NN), residual neural network (Resnet), and VIT, shows that Friction-1D Transformer has higher accuracy and faster training speed, with only 3915914 parameters. This research validates the feasibility of using raw texture data for training and skid resistance prediction, and the proposed model structure may facilitate the development of the testing technology for skid resistance of road surfaces.
0 引言
道路交通安全是多种因素共同作用的结果,其中,沥青路面的主要安全标准是胎面之间的相互作用,这与表面纹理特征直接相关,它有助于防滑和排水[1-3]。路面摩擦力是衡量路面行驶安全的重要指标,对于减少事故,尤其是在潮湿天气条件下的事故具有显著作用[4-5]。
传统的道路摩擦评价方法一般采用接触式摩擦测量设备得到摩擦系数,主要包括:英国道路与运输研究所(TRRL)生产制造的摆式仪、日本研制发明的动态摩擦系数测定仪(DFT)和英国制造的 SCRIM 横向摩擦系数测试车等[6-7]。然而,这些接触式摩擦测量设备存在易受环境干扰、阻碍交通、数据可重复性差等缺点[8]。随着三维激光测量技术和计算机算力的发展,非接触式的表面纹理测量设备引起广泛关注,学者们开始逐步使用路面三维纹理特征评价其路面抗滑性能。平均构造深度()和平均断面深度()是常用的路面纹理评价指标,但由于其仅表征路面的整体纹理状态,缺乏对轮廓细节特征的提取,因此传统的路面纹理指标不足以表征多样化路面的路面摩擦[9-11]。Liu 等[12] 提出了一种基于网格位移机制的改进 DBC(IMDBC)来估计三维路面纹理图像的分形维数,该方法可以基于分形和分层法找到最适合抗滑的分形纹理表面;Deng 等[13] 对三维路面表面纹理进行多尺度功率谱分析,探究了不同波长和接触面积比下路面摩擦力 C 与表面粗糙度功率谱 q 的关系。近年来,机器学习技术在计算机视觉领域得到广泛运用,越来越多的学者使用机器学习方法进行路面摩擦预测[14-15]。如 Zhan 等[16] 开发了集成快速傅里叶变换(FFT)和极端梯度提升(XGBoost) 框架,再利用自动三维纹理测量预测路面抗滑性能。然而,机器学习方法的最大局限性在于其无法处理原始数据,即必须进行预处理或特征提取,将原始数据转化为特征向量才能进行训练[17]。而深度学习技术(DL)允许机器接收原始数据,直接输出检测结果。 Yang 等[11]采用 DL 技术,基于卷积神经网络(CNN) 开发 FrictionNet 深度学习模型,用于使用高速路面纹理剖面数据进行非接触式路面摩擦评估。在此基础上,Zhan 等[18] 基于 ResNets 深度残差网络构建了专为摩擦预测和验证的 Friction-ResNets 模型,该模型能够学习和提取路面宏观纹理特征和分类边界,直接用于路面摩擦评估,分类准确率 91.3%,优于其他传统机器学习方法。
基于 CNN 为骨干的网络架构一直是计算机视觉领域的主流架构[19],Vision Transformer(VIT)模型出现后,其表现出的强大适应性使得研究人员开始将目光转向舍弃卷积操作的 Transformer 模型[20-21]。因此,本研究基于 VIT 模型对全局特征的提取能力,结合深度残差结构,开发用于路面纹理摩擦预测的模型网络。
1 数据采集与预处理
1.1 数据采集
试验采用最大公称粒径为 13.2 mm 集料 (AC-13)做成的 48 块沥青混合料车辙板试件,试件规格为 300 mm×300 mm×50 mm,集料为玄武岩,具体级配见表1。利用团队自主研发的多功能磨耗仪对室内成型车辙板进行磨耗,磨耗仪如图1(a)所示,每经历 5 万次磨耗使用摆锤式摩擦仪测量 NBPN,总计磨耗 50 万次,摆锤式摩擦仪如图1(b)所示。路面纹理数据采集设备使用 LS-40 便携式三维路面分析仪,见图1(c)所示,LS-40 可以扫描 102 mm×112 mm 的高精度纹理数据,取其中 2 048×2 048 个云点数据,水平精度为 0.05 mm,纵向精度为 0.01 mm,采集后的路面板如图1(d)所示。使用 LS-40 采集纹理数据,可以不受光照及环境的影响,进行室内车辙板及室外路面的数据采集。
表1 SMA-13 混合料级配
Table1 Grading of SMA-13 mixture
图1 试验仪器
Figure1 Testing instruments
1.2 纹理数据预处理
由于车辙板表面存在油光,且空气中存在细小灰尘颗粒,LS-40 采集到的纹理数据存在大量的噪声,其中包括明显的大离群值和存在于纹理表面的脉冲噪声。为保证纹理数据的真实性,对模型进行训练,在通过去噪方法对纹理数据进行去噪的同时,避免丢失原本的微观纹理数据。
1.2.1 异常值去噪
采集的原始纹理数据存在明显的异常值,如图2(a)所示,由于这类异常值和原始数据偏差较大,只需阈值滤波设置阈值将其去除。原始数据中的高程值介于 0~1 200,而离群值均大于 2 000,设置阈值为 2 000 的阈值滤波,超过阈值的噪声点替换为原始数据均值,去噪后的纹理如图2(b)所示。
图2 去除异常值前后路面纹理云图
Figure2 Cloud maps of road surface texture before and after outlier removal
1.2.2 纹理表面去噪
从图2(b)可以看出路表面的大致轮廓,但仍存在大量的噪声附着于纹理表面,由于这些噪声组成非常复杂,高斯滤波、中值滤波等单一的去噪方法,存在去噪效果不明显或过于平滑原始数据等问题。本研究采用快速傅里叶变换(FFT)将原始纹理数据转化为频率信号,将 104.8 mm(2 048×0.05 mm)作为一个时刻得到频率分布,如图3所示。
图3 单条纹理的频率信号
Figure3 Frequency signal of a single texture
宏观纹理波长大于 0.5 mm,由式(1)计算得到 0.5 mm 波长所对应频率 209.6 Hz,再将 0~209.6 Hz 与 209.6~1 024.0 Hz 的信号取出进行反向傅里叶变换后得到宏微观纹理,如图4所示,然后针对不同的噪点分别进行去噪处理。
(1)
式中:λ 为波长;c 为波速,本研究中,c=104.8 mm/t, 2 048 个点阵代表一个时刻 t;ν为频率。
图4 宏微观纹理分离图
Figure4 Macroscopic and microscopic texture separation
(1)微观纹理去噪
图5为截取的一段微观纹理信号图,可以看出原始的微观纹理噪声组成主要为小离散值与毛噪点。
为了不破坏其本身纹理,针对小离散值使用 DMAD离群值去噪。MAD 法的判断标准如式(2)、(3) 所示:
(2)
(3)
式中:x 为适用窗口大小的数据向量;n 为确定参数,本研究中取 3。
再针对毛噪点使用小波阈值去噪,对单条纹理信号经过小波变换分解,选取阈值为 0.2 去除噪声后进行重构。微观纹理去噪后的前后对比结果如图5所示。
图5 微观纹理去噪图
Figure5 Microscopic texture denoising
(2)宏观纹理去噪
从图4中可以看出:在滤除微观纹理后,宏观纹理只剩下某些局部不平整问题,只需使用简单的均值滤波去除噪声,均值滤波公式如下:
(4)
式中:i、j 为计算坐标点;g 为坐标点滤波后值;f 为坐标点原始值;k、l为卷积核的高和宽。
(3)纹理重构
高斯滤波可以对图像进行平滑处理,且能够很好地保留局部特征。将去噪后的宏观纹理与微观纹理重新组合后再通过高斯滤波平滑,高斯滤波公式如式 (5),最终去噪前后的路面局部纹理对比如图6所示。
(5)
式中:G( x,y)为二维高斯卷积核;σ 为标准差。
图6 去噪前后局部纹理图
Figure6 Local texture map before and after denoising
经过针对性去噪处理后,可以观察到车辙板表面纹理的脉冲噪声已被有效去除,并且有效保留了表面纹理的局部特征,从而确保了后续预测结果的真实性。
2 用于沥青路面抗滑预测的一维 VIT 混合模型
2.1 Vision Transformer
最开始 Transformer 模型的提出,主要是针对自然语言处理(NLP)领域,而在计算机视觉(CV)领域中,Transformer 模型的应用相对较少[21]。而随着 Vision Transformer(VIT)模型的出现,人们开始认识到 Transformer 模型在计算机视觉中具有较高的计算效率和可扩展性,并在图像分类任务中取得了卓越表现。与传统的卷积神经网络相比,VIT 在图像分类任务中表现出更好的性能,同时消耗较少的计算资源[22-23]。
沥青路面的抗滑预测与其他图像分类任务有所不同,因为其对应的摩擦系数难以通过人眼观测得出。路面纹理反映出的摩擦性能与其沿行车方向的整体特征密切相关。Vision Transformer (VIT)通过其独特的位置编码结构和多头注意力机制,展现了在图像全局特征提取方面的卓越性能。本研究中,受 VIT 模型的启示,开发了 Friction-1D Transformer 抗滑预测模型。与常规图像分类不同,选取沿行车方向单条一维纹理信号进行训练,采用了一维的图像处理方式,有效减少计算量,从而提升训练速度。通过借鉴 VIT 模型的设计理念,Friction-1D Trans-former 模型在处理沥青路面摩擦性能预测任务时,表现出良好的性能。该模型能够充分利用位置编码结构和多头注意力机制,提取沿行车方向的一维纹理信号中的全局特征,从而对路面摩擦性能进行准确预测,这对于提高沥青路面摩擦性能的评估和监测具有重要的实际应用价值。
2.2 Friction-1D Transformer 架构
Friction-1D Transformer 的整体架构见图7。对于 Patch Embedding 部分,模型的输入对象为 1× 2 048 像素的条形图,通过 128 个长度和步长都为 64 的一维卷积核后,图像被分割为 32 份,每一份都存储了原图像中 64 个像素值的信息,深度为 128。之后增加一个深度同样为 128 的可训练参数 Class token,在每个 token 前都加上位置编码信息,此时每个 token的 shape 为 33×128,最后输入 Transformer Encoder 进行计算。
Transformer Encoder 部分见图8,token 先通过层标准化后进入多头注意力(Multi-Head Attention)部分,多头注意力机制是 Transformer 模型的核心,其原理为:先输入通过 3 个全连接层生成与输入相同尺寸的 3 个参数向量 Q、K、V,再将 3 个向量以 head 长度进行均分得到 Qi、Ki、Vi,最后通过公式计算后重新拼接得到输出。
(6)
式中:Q 代表 query,会跟每个 K 进行匹配;K 代表 key,会跟每个 Q 进行匹配;V 代表从每个部分中提取到的信息;dk 代表划分长度 head 值。
先将得到 Multi-Head Attention 的输出之后使其与输入 token 相加,再通过一层层标准化进入 MLP Block。MLP 部分如图8所示。先通过第一层全连接层、GELU 激活函数和池化层将输入放大为 33× 512;再通过第二层全连接层和池化层还原尺寸;然后再与 Multi-Head Attention 的输出拼接后输出。因为 Transformer Encoder 部分的输出和输入的 shape 相同,故可将此部分堆叠,本研究中所使用的模型共堆叠了 6 次。Transformer Encoder 的输出分为 1 个用于分类的 Class token 和 32 个包含原始图像信息的 Image token。先将 Class token 输入 MLP Head 层得到类别输出;再将 Image token 通过 2 个残差层后得到的类别输出与其相加;最后通过 Softmax 函数得到最终预测结果。
图7 Friction-1D Transformer
Figure7 Friction-1D Transformer
图8 Transformer Encoder 部分
Figure8 Transformer Encoder
3 结果与分析
3.1 训练结果
本研究选取 456 块车辙板,每块车辙板 2 048 条纹理数据,为减少纹理相似性每隔 5 条纹理取 1 次,共计 184 910 张,分别用 60%、20%、20% 划分为训练集、验证集和测试集,用于 Friction-1D Transformer 模型的训练,摩擦数据共划分为 5 类,见表2。模型的可训练参数量为 3 915 914,相比传统的 VGG 模型和 ResNet 模型要小很多。模型训练所用权重更新方法为 SGD 优化器,初始学习率 0.1,迭代次数为 100 次,共耗时 3.9 h,达到最大训练和验证精度。如图9所示,随着迭代轮次的增加,训练集和验证集的准确率不断提升,且没有出现过拟合现象,最终训练集准确率达到 96.6%,验证集准确率达到 87.32%。
表2 NBPN分类情况
Table2 Classification of NBPN
图9 Accuracy 曲线
Figure9 Accuracy curve
3.2 测试结果及评价
为了更客观科学地评估该模型的测试性能,将 36 982 张测试集图像通过训练好的模型进行预测,以评价该模型对沥青路面摩擦性能和监测的有效性。用分类的准确率来评估其性能,预测结果见表3,混淆矩阵对角线上数值为预测正确结果,模型总预测正确数为 32 197,预测错误数为 4 785,总体测试集预测正确率为 87.06%。
表3 预测结果分布
Table3 Distribution of prediction results
由表3可知:Friction-1D Transformer 对摩擦等级有较好的预测精度,且距离正确结果越远的预测结果数量越少,这表明模型对肉眼难以判断的沥青路面抗滑评估是有效的。为更直观地展示该模型在测试性能方面的表现,采取随机抽样的方式,从测试集中选取了 100 个样本数据进行预测;再将真值按阶梯排列;最后将预测结果绘制成折线图,如图10所示,100 个样本中有 9 个样本没有落在真值阶梯上。
图10 样本测试结果
Figure10 Sample test results
3.3 与其他抗滑评价模型对比
尽管机器学习方法在图像分类任务中有局限性,但在深度学习方法普及之前,机器学习一直都是最有效的分类工具之一,为了对比不同评价模型的优劣,本研究选择了随机森林(RF)算法和 k 近邻算法(k-NN)与 Friction-1D Transformer(FT)进行对比,同时加入了纯 Vision Transformer 和深度残差网络(Resnet)的深度学习模型进行同样的训练。
随机森林是一个包含了多个决策树的分类器,其对于分类任务具有较高的精度,其最重要的两个调整参数是 N-estimators、max-features,N-estimators 是决策树的数量,max-features 是分裂节点考虑的随机特征子集大小,在本研究中使用 RF 的最高测试精度为 72.8%。k-NN 是一种广泛使用的非参数分类方法,其中,k 为考虑训练集中与新数据点最近的任意 k 个邻居,该算法先在训练集中寻找与这个新数据点距离最近的数据点,然后将找到的数据点的标签赋值给这个新数据点。本研究中使用 k-NN 的最高测试精度为 66.2%。深度残差网络具有学习和提取路面表面宏观纹理特征和分类边界的能力[24-25]。本研究采用 ResNet34 模型和 VIT 模型进行训练,其参数量见表4,最终的测试精度分别为 83.3% 和 85.9%。每种模型的最高测试精度见图11。
由图11可知:FT 模型在准确率方面表现出色,达到了 87.1%,k-NN 和 RF 则表现不佳,分别为 66.2% 和 72.8%,而 ResNet 模型和 VIT 模型的准确率分别为 88.3% 和 85.9%,虽然接近 FT 模型,但由表4可知,ResNet 模型和 VIT 模型在参数量上都非常庞大,这意味着它们需要更高性能的独立显卡 (GPU)来进行训练和预测。尽管本研究中使用的机器学习(ML)方法在该数据集上表现不佳,但由于时间限制,其重要参数并没有经过精心挑选。因此,未来使用机器学习(ML)方法仍然有很大的提升空间。
表4 3 种模型的参数量大小
Table4 Parameter size of three models
图11 模型测试精度比较
Figure11 Model accuracy comparison
4 结论
(1)本研究针对存在大量不同噪声信号的三维纹理数据,将纹理信号通过快速傅里叶变换进行宏微观分离,针对不同的噪声信号采用不同的去噪方法,在去除纹理噪声的同时也有效保留了表面纹理的局部特征,确保了有效性。
(2)本研究基于 Vision Transformer 的设计理念,开发了 Friction-1D Transformer 抗滑预测模型,并用于一维纹理信号抗滑评价,通过与随机森林(RF)、 k 近邻算法(k-NN)、深度残差网络(ResNet)和 Vision Transformer(VIT)4 种模型进行对比分析发现,Fric-tion-1D Transformer 有着较高的准确率和更快的训练速度,其参数量只有 3 915 914,可以有效进行沥青路面抗滑评价。
(3)目前研究所用的车辙板均为 AC-13,无法保证对于其他路面同样有效,但所使用的网络模型仍可进行其他路面类型的训练,未来仍可以使用更多样化的路面纹理数据进行研究。同时本研究中所使用的路面纹理数据并未分层,不同深度下的路表面纹理对摩擦做出的贡献也不相同,未来可以对分层后的路表面纹理进行模型的训练与预测。