一、多CPU并行结构神经网络目标识别系统(论文文献综述)
曹景军[1](2021)在《基于深度学习的双孢菇采摘机器人视觉系统研究》文中指出双孢菇是最常见的食用菌品种之一,其种植方式逐渐从传统的小规模个体栽培向规模化生产的智能工厂转变。在双孢菇智能工厂中,大多数生产工序已实现机械化和自动化,但采收成熟的双孢菇以及品质分级仍然主要依靠人工手动完成。人工采摘与品质分级劳动强度大、成本高并且十分枯燥。双孢菇自动采摘与品质分级成为该产业中的迫切需求。视觉系统是采摘机器人中的一项重要组成部分,开展双孢菇采摘机器人视觉系统研究对实现双孢菇自动化采摘及品质分级具有重要作用。本文围绕双孢菇自动采摘与自动品质分级的产业需求,重点研究了视觉系统中的多模态目标检测和轻量级品质分级核心算法,并搭建了双孢菇采摘机器人视觉系统,为实现双孢菇自动化采摘及品质分级提供了有力技术支撑。概括而言,本文的主要研究成果包括:(1)构建了双孢菇图像数据集合。为了提高双孢菇目标检测算法性能,构建了具有2300幅图像的双孢菇多模态目标检测数据集合,为了自动识别双孢菇品质等级,构建了具有1200幅图像的双孢菇品质分级数据集合,为开展相关研究提供了数据基础。(2)提出了一种多模态注意力融合网络进行双孢菇检测。该网络通过融合双孢菇可见光和深度图像特征来提取更全面的信息,采用多尺度架构增加感受野。使用注意力机制自适应地对特征通道进行标定,使网络关注于更重要的信息。当某个模态信息发生较大变化或者缺失时,通过模态间信息互补的方式,提升了检测器在光线较强和阴影条件下的准确性与健壮性。(3)提出了一种轻量级神经网络算法解决双孢菇品质分级问题。为了提高双孢菇品质分级效率,提出了一种压缩模块,该模块的主要设计思路是将串行的下采样操作和卷积运算转换成并行结构,基于该压缩模块,构建了一种轻量级神经网络‘Light Net’来解决双孢菇品质分级问题。所提出的网络具有更少的参数量和计算量,并且分级精度达到了97.50%。该网络通过提取双孢菇图像特征,自动将双孢菇分成优质和劣质两个级别,劣质中包括畸形和锈斑等情况。同时,为了测试该算法的泛化能力,在茭白品质分级图像数据集合上开展实验,分级精度达到95.62%,实验结果证明该网络可以拓展应用于其他有关农产品品质分级的任务中。(4)搭建了用于双孢菇采摘的机器视觉系统。设计并实现了双孢菇三维空间定位方法与双孢菇采摘路径规划方法,研发了双孢菇采摘机器人视觉系统,并将该视觉系统与双孢菇采摘机器人硬件装置进行集成,执行20组实验对视觉系统进行测试,实验结果证明了该视觉系统可以精确地检测与定位双孢菇。通过上述工作,本文对双孢菇自动采摘与品质分级问题进行了深入研究,研究结果表明:提出的多模态注意力融合网络提升了双孢菇检测性能。提出的轻量级神经网络具有更低的时间复杂度和空间复杂度,并且保持了相当的双孢菇品质分级精度。并将研发的视觉系统与双孢菇采摘机器人硬件装置进行了集成,实验结果证明了该视觉系统的准确性与有效性,为双孢菇自动采摘与品质分级提供了有力技术支撑。
刘蒙[2](2021)在《红外热成像图像中的人体行为检测技术研究》文中研究表明红外热成像图像中的人体行为检测是指在红外热成像图像数据中分析出人体目标进行的行为动作并生成符合用户浏览的描述语句,红外热成像数据包括视频、系列图像和单帧图像。该技术在危险行为检测、图像检索、人机交互、智能看护等领域都具有广泛的运用前景,因此逐渐受到更多学术界和工业界研究学者的广泛研究。当前人体行为检测算法在原始数据中存在大量冗余数据以及未利用人体行为和周围目标的相关性、人体行为的连续性和多张图像之间的时序性等问题。为解决上述问题,本文提出了红外热成像图像中的人体行为检测算法,以红外热成像图像为基础,结合深度学习算法对人体行为检测技术进行研究,实现红外热成像图像中的人体行为检测,本文主要研究内容包括:(1)针对目前使用的红外热成像数据中存在数据冗余和较多与人体行为不相关图像等问题,提出基于改进孪生网络的图像关键帧提取算法。首先,采用针对本文改进的VGGNet-16网络取代原始孪生网络中的Alex Net结构,改变数据输入方式,采取2-channel输入模式,同时依次输入两张相邻帧,利用VGGNet-16网络提取图像的特征信息,使用该网络最后全连接层的1000维度信息进行图像相似度计算,依据预先设定的双阈值,实现原始图像的初步分类;然后,利用基于改进YOLO v3网络模型实现图像中的目标识别,使用目标识别信息,对初步的分类图像进行筛选,完成最终的图像关键帧提取工作;设计改进的VGGNet-16网络和YOLO v3网络组成并行结构,降低了本文算法的模型深度。实验结果表明,该算法可以有效解决数据冗余问题,提取的关键帧更具针对性,在不同数据集上平均准确率为92.5%,平均提取时间为22.5s,明显提高关键帧提取速度和准确率等相关性能,为本文后续工作的进行奠定良好基础。(2)针对目前红外热成像图像中的人体行为检测算法中未利用图像中人体行为与周围目标相关性、系列图像时序性以及检测描述过于简单等问题,提出基于改进视觉词袋编码模型的人体行为检测算法。首先,采用注意力机制模型,实现图像中不同目标对于人体行为检测影响权重的初次赋值;然后,利用改进的YOLO v3网络获取的目标空间位置信息,更新不同目标的权重信息,最大化利用与人体行为有关的目标信息,基于改进视觉词袋模型,完成图像词汇信息的编码;最后,通过系列图像的时序信息,利用双向长短期记忆网络(Bi-LSTM)进行解码,并使用KL散度与人为标注的数据标签,构建损失函数进行网络的训练。实验结果表明,该算法生成的人体行为描述语句与图像画面信息基本符合,在数据集上平均精确率达91.0%,且具有较快的检测速度和较高的鲁棒性;本文提出的关键帧提取算法能进一步提升该人体行为检测算法的性能。
李思寒[3](2021)在《基于机器视觉三维成像与卷积神经网络的目标识别研究》文中研究指明在工业生产中安全是首要任务,但日益复杂的工业现场环境给安全生产带来了极大挑战。当前工业现场常用的安全监测方法有:基于人工的巡查方法、基于机器视觉三维成像的目标识别方法、基于卷积神经网络的目标识别方法。人工巡查的检测精度、频率和范围都是有限的,因此基于机器视觉三维成像和基于卷积神经网络的目标识别方法得到了广泛应用,并能够运用于极端恶劣环境中,但基于机器视觉的三维检测方法自动化程度仍然不高,往往需要辅以人为监测。针对以上问题,本文首先对基于机器视觉的三维成像方法进行研究,提出了基于张氏的加权标定法,并将该方法应用于采用半周期反向相位误差补偿的相移条纹投影三维成像系统中,提高了工件尺寸的三维测量精度和成像检测精度。进一步地,本文研究了基于卷积神经网络的目标识别方法,建立了VGG16结合早停法的模型,该方法能够有效减少训练成本,实现了对工业现场漏液的自动快速检测。本文的主要研究工作和创新如下:1、本文分析了标定板角点的重投影误差分布规律,并提出了基于张氏的加权标定法。该方法根据二维高斯数学模型建立加权目标函数,通过迭代计算得到相机参数的最优解,提高了系统整体校准精度,使标定的重投影误差从0.0434减小为0.0232。并将加权标定法应用于采用半周期反向相位误差补偿的相移条纹投影三维成像系统中,消除了非线性响应造成的周期性相位谐波误差,有效提升了三维成像显示效果和三维测量精度。2、本文分析了噪声模型、图像滤波和分割算法,并根据图像中背景噪声过多、目标物体表面噪声较少且形状较为规律的特点,提出了中值滤波结合人工框选的Otsu阈值分割算法,该方法有效地消除了相机拍摄时投影仪亮度高造成的图像噪声并保留了目标物体的边缘信息。3、本文搭建了工业现场管道漏液检测系统,该系统采用了VGG16结合早停法的模型,并通过与多种基于卷积神经网络的模型进行对比,验证了该模型的优越性:其训练准确率为99.44%,预测准确率达到97.00%,单张预测时间最短约为0.2s,综合性能最优,且该模型原理较为简单,易于实现,系统搭建成本较低,可以满足工业现场的检测需求。
缪显涵[4](2021)在《多源信息融合多目标跟踪技术研究与设计》文中研究说明多源信息融合的多目标跟踪技术是通过联合处理来自多个信息源数据,并提取目标的融合特征,实现多目标跟踪的全新技术。该技术能够解决多目标跟踪系统应用中精度不足的问题,在无人自主环境感知领域具有重要的研究价值。传统的多目标跟踪技术受传感器自身的限制,难以满足复杂环境下的目标跟踪要求。而利用不同传感器获取的异构信息,能够为目标跟踪提供完整有效的信息,有助于目标的高精度跟踪,是多目标跟踪技术的重要发展方向。本文开展了真实环境下的运动目标检测、运动目标特征提取、目标跟踪指派和身份信息管理等工作,并研究了图像和微动特征理论,主要内容如下:1.提出了一种基于毫米波雷达和运动目标微多普勒效应的目标识别算法。采用本文所构建的卷积网络结构,对时频变换后的雷达时频谱图进行特征学习,解决传统方法中对时频特征提取不充分的问题,改善了毫米波雷达在目标识别领域的缺陷,目标识别准确率的达到81.02%,召回率达到90.77%。2.提出了一种雷达信号的微多普勒信息和图片的纹理信息融合的目标识别算法。通过建立毫米波雷达和摄像头空间坐标系,运用联合标定的方法得到了观测场景中的感兴趣区域。并且搭建并行结构的融合目标识别网络框架,对多模态信息进行特征提取和特征融合,解决了信息模态的差异性与融合结果的有效性间的矛盾。本文所提出的融合模型的m AP(mean Average Precision,m AP)达到了89.42%,比单模态传感器的性能最多提升了32.76%。3.设计了一种基于毫米波雷达和改进的Deep SORT(Simple online and Realtime Tracking,SORT)框架的多目标跟踪算法。由于卡尔曼滤波和Deep SORT算法分别在雷达目标跟踪和视频目标跟踪中具有优势,将融合目标识别网络处理后的目标特征和卡尔曼滤波器获得的目标物理信息进行数据关联,实现了多目标跟踪。在融合采集的数据集上进行测试验证,该算法的MOTA指标达到82.54%,MOTP为80.46%,解决了在不同的光照、不同的视场,以及强电磁杂波环境的情况下单一传感器跟踪精度不足的问题。本文所提出的多源信息融合多目标跟踪算法通过理论研究分析和实测数据集的实验,验证了深度学习应用于时频运动特征的正确性,证明了算法的有效性。
钟银都[5](2020)在《基于CPU和GPU的雷达目标识别算法并行实现》文中研究说明现代战争对雷达的自动化和智能化水平提出了较高的要求,以雷达目标识别为代表的智能信息处理技术受到了广泛的关注。随着雷达信号带宽的持续提高以及识别数据库中目标种类的不断增加,给实时地完成目标识别任务带来了极大的挑战。由于雷达目标识别任务具有良好的并行结构,高效的并行处理算法成为了目标识别技术领域的研究热点。与此同时,以中央处理器(CPU)和图形处理器(GPU)为代表的硬件处理器的并行处理能力也越来越强大,这为雷达目标识别算法的并行加速提供了可能。基于上述背景,本文开展了雷达高分辨距离像(HRRP)识别相关算法的并行设计研究,并在多核心CPU处理器硬件平台和CPU+GPU的异构平台下进行了算法实现。主要工作内容概括如下:1.结合线性调频脉冲体制雷达HRRP识别流程,对每个环节常用算法的原理进行阐述。首先介绍了针对大时宽带宽信号脉冲压缩处理的分段脉冲压缩算法;然后介绍了针对相参积累期间目标越距离单元走动问题的Keystone变换及其两种常用实现方式,即DFT+IFFT算法和Chirp-Z算法;接着介绍了针对HRRP数据敏感性问题的常用预处理方法;最后介绍了四种经典的统计识别模型和卷积神经网络识别模型。2.阐述了CPU和GPU处理器硬件结构的区别,然后给出了针对多核心CPU处理器并行编程的C++11多线程编程方法,以及针对NVIDIA GPU处理器并行编程的统一计算架构(CUDA)的编程、执行模型。最后给出了CUDA并行编程的调试分析方法及内核优化技巧。3.详细分析了HRRP识别流程中各算法的并行结构,针对性地设计了相应的并行实现方案,完成了各个算法在CPU平台下的单线程实现和多线程并行实现以及在CPU+GPU平台下的多线程并行实现。通过仿真实验检验了各算法在两种并行实现方式下的运行结果,并以CPU单线程运行时间为基准,对比分析了两种并行实现方式下的加速效果。其中,分段脉冲压缩算法、DFT+IFFT算法、Chirp-Z算法、迭代对齐算法、最大相关系数(MCC)分类器和自适应高斯分类器(AGC)的建模、MCC识别、AGC识别、因子分析(FA)建模和复因子分析(CFA)建模过程的CPU多线程实现可以达到3~5倍的加速效果,相应的GPU并行实现也都可以达到5倍以上的加速效果;此外,基于卷积神经网络的识别方法也取得了一定的加速效果。这说明基于CPU的多线程并行实现方式和基于CPU+GPU异构平台的并行实现方式能够显着提升雷达目标识别任务的实时性。
王春宏[6](2020)在《基于FPGA的输电线路缺陷智能识别》文中提出输电线路是国家电网系统的重要基建,其安全稳定的运行是电能传输的重要保证。国家必须每年花费大量的人力物力用于对输电线路的巡检工作,才能有效地排除安全隐患。但随着电力工业的不断发展,供电地区和线路总长度也不断增长,传统的人工巡线已经不能满足实际要求,需要采用新的巡线技术来智能识别输电线路上的待检测目标并判断是否存在缺陷。图像处理和深度学习技术的快速发展,为缺陷的智能识别提供了实现的可行性。FPGA等芯片的进一步升级,为数字图像处理和卷积神经网络硬件加速的实现提供了硬件平台。本文将以输电线路的可见光图像为数据源,以FPGA开发板为硬件平台,依次完成对输电线路上元器件的识别、目标图像的分割以及最后的缺陷检测。首先,采用硬件加速实现卷积神经网络,用于识别输电线路图像中的待检测目标,为缺陷的分类检测提供依据。先在PC端完成了对网络模型的搭建和训练,确定该网络能够识别目标元器件。再卷积神经网络的并行性运算加以改进,并成功将其移植到FPGA上,实现了对卷积神经网络的硬件加速。最后通过实验验证了卷积神经网络在是硬件平台上识别目标的可行性。其次,采用了一种由直方图均衡化、阈值分割、形态学滤波和Sobel边缘检测融合的图像分割方法,成功将图像中的目标与背景分离,获得便于缺陷检测的目标轮廓图像。利用直方图的均衡化完成对图像的预处理,解决图像的曝光问题,增强图像中待检测目标和背景的对比度;采用改进的局部自适应阈值分割算法,解决了光照不均匀情况下图像分割不理想的问题,成功将待检测目标从图像中分割出来;利用形态学滤波消除图像背景噪声和小物体的干扰,扩张待检测目标的高亮区域,增强图像效果;利用Sobel边缘检测提取目标的外侧轮廓,为缺陷检测提供依据。在FPGA端采用自上而下的模块化设计,完成了对上述算法的移植,成功在硬件平台上实现了图像分割,并在实验中获得了良好的图像分割效果。最后,针对绝缘子缺陷提出了一种基于绝缘子轮廓信息的缺陷检测算法,并成功在FPGA上实现,达到了缺陷检测的目的。先从目标的轮廓图像中提取出了绝缘子的上边缘和下边缘曲线图,再利用局部加权回归算法(LOWESS)平滑曲线以便于获得绝缘子片的波峰值,最后利用相邻波峰之间的距离关系确定是否存在绝缘子掉片缺陷,完成了对绝缘子的检测。
李昕卓[7](2019)在《基于CNN的SAR目标识别FPGA加速器设计》文中研究指明合成孔径雷达(SAR)目标识别即从包含背景杂波的干扰信息中提取有效目标特征,并对目标分类识别,该技术在军事打击和情报获取等领域有着广泛的应用。随着SAR图像分辨率的提升,目标识别难度逐渐增大,如何从海量SAR图像中快速、准确地对目标分类识别,成为SAR研究领域的热点。近年来,卷积神经网络(CNN)因其出色的特征提取能力已被很多学者应用于SAR目标识别。然而,CNN网络复杂度的提升导致中央处理器(CPU)已很难完成大规模计算,实时进行目标识别更是难上加难;图形处理器(GPU)加速性能突出但功耗太大,不能满足工程应用;相比之下,现场可编程门阵列(FPGA)具有低功耗、高并行度和开发灵活等特点,被视为最具潜力的硬件加速平台。基于以上背景,本文主要研究基于CNN的SAR目标识别方法,并以FPGA作为硬件加速平台,设计面向SAR目标识别的CNN加速器。首先,针对SAR目标识别特定应用,为了提高识别准确率,对传统CNN网络进行改进,设计了一种基于全卷积神经网络的SAR目标识别方法;同时扩充运动和静止目标获取与识别(MSTAR)数据集,以避免网络过拟合现象的产生。通过网络可视化分析、准确率曲线、损失变化曲线和传统CNN网络的对比实验,验证本文方法的有效性。其次,针对SAR多目标识别问题,引入全卷积神经网络结构,对Faster-RCNN中的CNN特征提取器进行改进;为了解决SAR数据稀缺问题,对多目标数据集进行扩充,并制作VOC2007标准数据集对网络进行训练测试。通过分析在不同背景下多种类型目标的识别结果,验证本文方法的有效性。最后,针对CPU平台上SAR目标识别运行效率较低问题,根据改进CNN网络并行结构特点,以FPGA-ZYNQ UltraScale+MPSoC为硬件加速平台,采用Verilog/C语言联合设计与软硬件协同设计方法,完成加速器各模块设计。为了进一步提高加速器性能,本文通过以下几个方面进行优化设计:第一,以二维卷积运算单元为基础,设计并行度为16的卷积矢量运算单元,提高卷积模块的运算效率;第二,设计双倍速率同步动态随机存储器(DDR)缓存结构,以提高数据缓存效率;第三,使用C语言对Softmax分类器进行设计,提高分类精度,并提出四种优化方法实现最小延时。之后,分别从加速性能、识别效率、资源利用率及功耗方面分析FPGA加速器性能,并通过与其它加速方案对比,验证本文设计FPGA加速器的高效性。
何敏雅[8](2018)在《基于Zynq平台的水下目标识别关键技术研究》文中进行了进一步梳理随着各国对水下探测活动的深入开展,应用需求不断扩大。在军事领域,对水环境中可能存在的危险目标如水雷进行排查是确保水下安全性的重要环节。由于模板匹配、支持向量机等传统方法在水下目标识别中往往存在识别精度较低、重建过程复杂等问题,需要寻找更优的方法提高识别率及对图像变换的适应性。大数据时代的到来使得深度学习方法逐渐替代了传统的目标识别方法,卷积神经网络(Convolutional Neural Networks,CNN)作为深度学习算法的重要分支也逐步应用于水下目标的识别。CNN对于图像的位置平移、比例缩放、角度倾斜、空间旋转等各种形式的变换均有良好的适应性,且网络采取端对端模式,避免了复杂的重建过程。但为了得到更高的精度,CNN模型的计算量和参数量不断扩大。在探测过程中,大量计算及参数存储会对设备的功耗及实时性提出极大的挑战。针对上述问题,本文选取了识别率较高、计算量和参数量较小的卷积神经网络MobileNet作为水下目标识别的基础架构,并提出了基于深度可分离卷积的并行化加速框架。同时采用复用和可配置性设计的形式将资源和功率消耗尽可能降低,以满足无人潜航器等搭载环境对设备便携性及低功耗的要求。本文使用以Zynq7z045为核心的ZedBoard开发板为硬件实现平台,采用CPU与FPGA结合的形式搭建整体计算框架。设计有三方面的关键技术及难点:首先,区别于大部分研究中基于标准卷积的并行化运算方式,本课题对基于深度可分离卷积方式的MobileNet架构设计专门的并行化加速单元,在此基础上采取复用片上缓存及计算资源的形式实现架构整体运算。其次,通过可配置的设计,使单层深度可分离卷积能够支持多层不同配置的运算,同时通过配置运算启动次数实现不同压缩程度的架构。最后,对架构的整体控制时序进行优化,实现卷积层间最大程度的并行运算,进一步提高系统的实时性和硬件加速单元的资源利用率。课题采用卷积层间流水线并行运算的方式代替串行计算为主的控制时序,将系统运算速率提高了2.83倍。同时在未压缩架构的基础上配置了0.25和0.5倍压缩程度的架构进行测试,在100 MHz架构压缩比为0.5和0.25倍的情况下,系统帧率可达到1.38 fps和5.52 fps。相比于近年在Zynq7z045上实现的深度CNN架构,本设计具有更小的资源开销、更低的运行功耗,同时在计算速度上也具有一定优势。在无人潜航器目标追踪,水下机器人排雷等任务中具有一定的应用前景。
任云[9](2018)在《基于区域卷积神经网络的光学遥感图像部分遮挡目标检测识别技术研究》文中研究表明目标检测是遥感图像解译领域的重要任务和研究热点之一。随着传感器的发展,遥感图像分辨率越来越高,遥感图像目标解译需求越来越明显。如何在复杂的背景中迅速找到尺寸比较小的目标以及如何高效检测出处于部分遮挡情况下的目标是亟待解决的难题。目前主流的基于深度学习的目标检测方法对于处理大尺寸目标优势很明显,然而将这些算法直接应用到遥感图像中时其性能会显着下降。针对这些情况,本论文在基于区域特征的卷积神经网络两阶段目标检测模型基础上,从数据预处理、卷积特征提取网络结构和损失函数三个方面入手,创新性地提出了用于解决小目标和部分遮挡目标检测的形变Faster RCNN检测框架。本文的主要工作及其创新点如下:1、提出了基于全卷积网络结构和跳层连接的Fast RCNN目标检测模型。论文在对Fast RCNN中的特征提取器和按区域的多层感知机分类器进行彻底的分析基础之上,详细推导了存在卷积层和池化层并行结构的全卷积网络结构(主要是Inception网络及其变体)中的输入输出关系,指出Fast RCNN框架在利用这类全卷积网络结构作为主干网络时其输入图像尺寸必须满足一定的条件;然后基于HyperNet网络结构的思想提出采用跳层连接方式对卷积网络特征提取器进行多层特征融合,从而使得最后提取的特征既有高层语义信息也包含了底层视觉信息;最后对按区域的多层感知机分类器深入研究并从实验得出基于区域的两阶段目标检测算法只要仔细设计按区域的分类器可以一定程度上提高目标检测性能,使得对基于区域候选的两阶段目标检测框架的整体架构有着更深刻地理解。2、提出了基于自顶向下的共享特征网络结构的光学遥感小目标检测。首先,针对遥感目标尺寸小的特征,深入分析Faster RCNN的共享特征提取网络结构,提出一种自顶向下的网络结构单元对多个阶段的特征进行融合以生成尺寸更大的特征图,并通过无监督聚类方法设置锚点的预设尺度和长宽比使之更加符合数据集的目标分布,从而在保持较高的小目标召回率的情况下尽可能多的捕获疑似小目标的候选区域;其次,针对ROI Pooling层中存在两次量化操作造成的小目标候选特征图区域匹配误差大的问题,将其替换成ROI Align层,降低量化操作所产生的误差,从而提高小目标分类和回归的准确度;然后提出一种编码方式来利用候选区域的邻域上下文区域,增强对小目标的特征;最后在数据预处理阶段,针对数据集中图片少以及存在严重的类别不平衡问题设计一种简单的数据集平衡采样方法,从而实现数据集的有效扩增。3、提出了基于聚集多层卷积特征的形变Faster RCNN的光学遥感部分遮挡目标检测。首先将前面所提出的自顶向下的特征融合网络结构与形变卷积嵌入到共享特征提取阶段来建模光学遥感目标的几何形变,使得所提取的特征包含丰富的的几何形变信息。然后针对类间遮挡的情况提出一种随机覆盖算法来扩增不同遮挡情况的目标,其随机性能够保证对于各种遮挡条件的泛化能力;针对类内遮挡提出将RPN阶段的边框回归损失函数替换成用于解决人群遮挡的排斥损失函数,在实验中从另外的角度分析其对于类内遮挡的有效性。为了进一步提高小目标的性能,进一步分析了RPN阶段所采用的自顶向下的网络结构单元的数量与锚点之间的内在联系,并且采用在线难例挖掘算法来引导网络的训练,使得最终的实验效果显着提升。
艾俊[10](2016)在《基于Spark混合神经网络的手写字识别研究》文中进行了进一步梳理当集成电路快速发展之时,计算机相关的硬件芯片的相关功能和模块也在逐渐成熟,功能也在不断加强,这些科技的进步也让更大规模的软件能较好的发挥其高效的功能。Apache Spark作为一种热门的分布式框架,能较好的加速密集型计算过程;深度学习已经发展到各行各业中,其中卷积神经网络也是最为成熟的算法之一,但随着大数据时代到来,常规平台不能很好让卷积网络发挥其高效的性能。故此用Spark分布式框架来加速卷积网络,让其展现高效的性能,在研究领域,商业领域具有重要的意义。在Apache Spark分布式平台上实现卷积神经网络,并用混合卷积神经网络处理相关的手写字识别是本文的重点研究内容。在研究中针对卷积神经网络架构,详细探讨了如何并行,计算模块划分,拓扑结构设计以及参数,层数等的设计,通过在Apache Spark上实现,主要在以下几个方面进行相关研究:1.首先详细分析卷积神经网络的各种网络并行架构,比较各自优缺点,结合了Spark集群的特点,选取了适合卷积神经网络在Spark集群上运行的硬件架构,相关参数,层数,卷积核等等。同时也考虑了在资源约束的条件下,如何划分相关计算模块让其并行能取得更好的性能;2.在Spark分布式平台上实现了混合卷积神经网络,包括接口,参数,以及一些连接顺序等。同时我们提出了网络融合架构,即用两个不同卷积神经网络首先同时提取相同图片特征,然后进行相关处理,接着进行特征融合,最后进行分类获取最终结果,提高了识别速度;3.利用Spark混合卷积神经网络进行了手写字识别,实验结果表明该方法具有较快的识别速度与较高的识别率。我们利用大量的实验去验证本文提出的模型以及相关算法,并用提出的并行模型去识别手写字,在相同情况下,将其与其它算法进行了比较,实验表明本文提出的并行算法取得了较好的性能。
二、多CPU并行结构神经网络目标识别系统(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、多CPU并行结构神经网络目标识别系统(论文提纲范文)
(1)基于深度学习的双孢菇采摘机器人视觉系统研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景 |
1.2 国内外研究现状 |
1.2.1 目标识别与目标检测技术研究现状 |
1.2.2 目标定位技术研究现状 |
1.2.3 农业机器人视觉系统研究现状 |
1.3 研究目的与意义 |
1.4 研究思路与内容 |
1.4.1 主要研究思路 |
1.4.2 主要研究内容 |
1.5 研究的创新点 |
1.6 论文组织结构 |
第二章 相关理论基础及开发工具 |
2.1 机器学习理论 |
2.1.1 机器学习方法 |
2.1.2 过拟合与欠拟合 |
2.1.3 超参数与验证集 |
2.1.4 优化算法 |
2.1.5 学习方式 |
2.2 卷积神经网络 |
2.3 反向传播 |
2.4 深度学习框架 |
第三章 数据集合构建 |
3.1 双孢菇目标检测图像数据集合构建 |
3.1.1 光学系统 |
3.1.2 数据采集与整理 |
3.1.3 数据标注 |
3.1.4 数据增广 |
3.2 双孢菇品质分级图像数据集合构建 |
3.3 品质分级算法泛化能力验证数据集合构建 |
3.3.1 光学系统 |
3.3.2 数据采集 |
3.3.3 数据预处理 |
第四章 基于深度卷积神经网络的双孢菇目标检测 |
4.1 单模态双孢菇目标检测 |
4.1.1 基于CenterNet检测器的双孢菇检测 |
4.1.2 基于注意力融合检测器的双孢菇检测 |
4.2 多模态双孢菇目标检测 |
4.2.1 多模态注意力融合网络架构 |
4.2.2 网络训练 |
4.3 实验结果对比分析 |
第五章 基于轻量级神经网络的双孢菇品质分级 |
5.1 卷积运算计算量与参数量 |
5.2 压缩模块 |
5.3 轻量级神经网络LightNet |
5.4 网络训练 |
5.5 实验结果对比分析 |
5.6 泛化能力测试 |
第六章 双孢菇采摘机器人视觉系统原型 |
6.1 系统总体设计 |
6.2 系统模块设计 |
6.3 目标三维空间定位设计与实现 |
6.4 采摘路径规划方法设计与实现 |
6.4.1 多区域采摘路径规划方法 |
6.4.2 行顺序采摘路径规划方法 |
6.5 系统集成与测试 |
6.5.1 边缘计算平台对比分析 |
6.5.2 系统环境配置 |
6.5.3 系统集成 |
6.5.4 系统测试 |
第七章 总结与展望 |
7.1 总结 |
7.2 展望 |
参考文献 |
致谢 |
作者简历 |
(2)红外热成像图像中的人体行为检测技术研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究目的 |
1.2 研究意义 |
1.3 国内外研究现状 |
1.3.1 国外研究现状 |
1.3.2 国内研究现状 |
1.4 论文的主要研究内容 |
1.5 论文的组织结构 |
第2章 红外热成像图像中的人体行为检测相关技术研究 |
2.1 引言 |
2.2 红外热成像原理分析 |
2.3 特征提取 |
2.3.1 基于传统方法的特征提取 |
2.3.2 基于深度学习的特征提取 |
2.4 目标检测 |
2.4.1 基于传统方法的目标检测 |
2.4.2 基于深度学习的目标检测 |
2.5 关键帧提取 |
2.5.1 基于语义的关键帧提取算法 |
2.5.2 基于SIFT特征的关键帧提取算法 |
2.5.3 基于BOF的关键帧提取算法 |
2.6 行为识别 |
2.6.1 人体行为检测相关数据集 |
2.6.2 人体行为识别模型的建立 |
2.7 本章小结 |
第3章 基于改进孪生网络的图像关键帧提取算法 |
3.1 引言 |
3.2 孪生网络分析 |
3.3 基于改进孪生网络的图像关键帧提取算法 |
3.3.1 整体框架 |
3.3.2 相邻帧输入模式 |
3.3.3 特征提取与目标识别 |
3.3.4 相邻图像相似度比较 |
3.3.5 并行的网络结构 |
3.3.6 关键帧提取流程 |
3.4 实验结果与分析 |
3.4.1 数据集及数据预处理 |
3.4.2 实验配置与模型参数 |
3.4.3 定性分析 |
3.4.4 定量分析 |
3.5 本章小结 |
第4章 基于改进视觉词袋编码模型的人体行为检测算法 |
4.1 引言 |
4.2 基于改进视觉词袋编码模型的人体行为检测描述方法 |
4.2.1 整体框架 |
4.2.2 结合注意力机制的视觉词袋编码 |
4.2.3 目标间的相对距离 |
4.2.4 改进的视觉词袋信息编码 |
4.2.5 基于Bi-LSTM的图像词汇解码 |
4.3 实验结果与分析 |
4.3.1 实验设置与模型参数 |
4.3.2 评价指标 |
4.3.3 定性分析 |
4.3.4 定量分析 |
4.4 本章小结 |
第5章 总结与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
攻读硕士学位期间取得的成果 |
致谢 |
(3)基于机器视觉三维成像与卷积神经网络的目标识别研究(论文提纲范文)
致谢 |
摘要 |
abstract |
第一章 绪论 |
1.1 课题研究背景与意义 |
1.2 基于机器视觉三维成像的目标识别方法 |
1.2.1 三维测量系统模型 |
1.2.2 系统模型标定方法 |
1.3 基于卷积神经网络的目标识别方法 |
1.4 本文主要研究工作 |
1.4.1 论文主要研究目的及内容 |
1.4.2 论文章节安排 |
第二章 数字图像处理 |
2.1 图像噪声模型 |
2.2 图像滤波算法 |
2.3 图像分割算法 |
2.3.1 基于边缘检测的图像分割法 |
2.3.2 基于最大类间方差法的阈值分割 |
2.4 实验结果 |
2.4.1 滤波算法实现 |
2.4.2 滤波结合边缘检测算法 |
2.4.3 中值滤波结合Otsu阈值分割 |
2.4.4 三维成像 |
2.5 本章小结 |
第三章 相移条纹投影三维成像系统 |
3.1 相机成像光路模型 |
3.1.1 针孔成像模型 |
3.1.2 相机镜头畸变模型 |
3.2 基于张氏标定法的加权标定法 |
3.2.1 张氏标定法计算内外参数 |
3.2.2 特征点权重模型 |
3.2.3 非线性加权优化 |
3.3 相移条纹投影 |
3.3.1 标准四步相移法 |
3.3.2 相位打包裹 |
3.3.3 相位展开 |
3.4 相位误差模型及补偿 |
3.4.1 相位误差模型 |
3.4.2 半周期法反向相位误差补偿 |
3.5 实验结果 |
3.5.1 标定实验 |
3.5.2 系统实验 |
3.6 本章小结 |
第四章 基于卷积神经网络的目标识别 |
4.1 引言 |
4.2 卷积神经网络模型 |
4.2.1 图像分类模型 |
4.2.2 早停法 |
4.2.3 模型评价 |
4.3 工程实际应用 |
4.3.1 系统搭建 |
4.3.2 传统图像处理方法及结果分析 |
4.3.3 基于CNN-VGG16 模型的图像处理技术 |
4.3.4 对比实验 |
4.3.5 不同应用场景 |
4.4 本章小结 |
第五章 总结和展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
攻读硕士学位期间的学术活动及成果情况 |
1)参加的学术交流与科研项目 |
2)发表的学术论文(含专利和软件着作权) |
(4)多源信息融合多目标跟踪技术研究与设计(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究工作的背景与意义 |
1.2 国内外研究现状 |
1.2.1 多源信息融合技术研究现状 |
1.2.2 目标跟踪技术研究现状 |
1.3 本文的主要贡献与创新 |
1.4 本文的内容结构安排 |
第二章 多源信息融合的多目标跟踪总体框架设计 |
2.1 需求分析 |
2.2 传感器融合平台设计 |
2.2.1 毫米波雷达参数设置 |
2.2.2 视觉摄像头参数设置 |
2.3 多源信息融合的多目标跟踪算法方案设计 |
2.4 本章小结 |
第三章 基于毫米波雷达微多普勒效应的目标识别算法 |
3.1 毫米波雷达运动目标回波模型构建 |
3.1.1 雷达波形选择 |
3.1.2 人体运动模型构建 |
3.1.3 车辆运动模型构建 |
3.2 时频分析方法 |
3.2.1 微多普勒效应 |
3.2.2 毫米波雷达回波时频变换算法 |
3.2.3 基于卷积神经网络的时频分析算法 |
3.3 毫米波雷达目标回波模型建模验证 |
3.3.1 运动目标回波模型建模的仿真实验及分析 |
3.3.2 运动目标回波模型建模的实测实验及分析 |
3.4 基于毫米波雷达的目标识别算法的实验及分析 |
3.4.1 目标检测实测实验及分析 |
3.4.2 目标识别算法实测实验及分析 |
3.5 本章小结 |
第四章 多源信息融合目标识别 |
4.1 多源信息融合目标识别算法架构 |
4.2 时空数据融合 |
4.2.1 坐标转换 |
4.2.2 毫米波雷达和摄像头联合标定 |
4.3 毫米波雷达和摄像头信息融合的目标识别 |
4.3.1 融合感兴趣区域确定算法 |
4.3.2 融合目标识别网络框架 |
4.4 基于多源信息融合目标识别算法的实验验证及分析 |
4.4.1 实测数据集建立 |
4.4.2 联合标定实验结果及分析 |
4.4.3 实验评价标准 |
4.4.4 毫米波雷达和摄像头信息融合的目标识别算法实验及分析 |
4.5 本章小结 |
第五章 多源信息融合的多目标跟踪 |
5.1 多源信息融合的多目标跟踪算法框架 |
5.1.1 算法流程设计 |
5.1.2 融合状态模型建模 |
5.2 目标运动状态估计算法 |
5.2.1 K均值聚类 |
5.2.2 多目标匹配 |
5.2.3 卡尔曼滤波 |
5.3 目标跟踪指派 |
5.3.1 级联匹配算法 |
5.3.2 改进的匈牙利匹配算法 |
5.4 目标跟踪算法的实测验证与分析 |
5.4.1 实验评价标准 |
5.4.2 实验结果与分析 |
5.5 本章小结 |
第六章 全文总结与展望 |
6.1 全文总结 |
6.2 后续工作展望 |
致谢 |
参考文献 |
攻读硕士学位期间取得的成果 |
(5)基于CPU和GPU的雷达目标识别算法并行实现(论文提纲范文)
摘要 |
ABSTRACT |
符号对照表 |
缩略语对照表 |
第一章 绪论 |
1.1 雷达目标识别简介 |
1.2 研究背景 |
1.3 并行计算在雷达领域的研究现状 |
1.4 CPU处理器的发展 |
1.5 GPU处理器的发展 |
1.6 论文的工作安排 |
第二章 雷达HRRP目标识别基本方法 |
2.1 HRRP相关概念 |
2.2 HRRP识别的基本流程 |
2.3 脉冲压缩 |
2.3.1 匹配滤波原理 |
2.3.2 分段脉冲压缩技术 |
2.3.3 仿真实验结果 |
2.4 基于Keystone变换的相参积累算法 |
2.4.1 Keystone变换原理 |
2.4.2 DFT+IFFT算法原理 |
2.4.3 Chirp-Z算法原理 |
2.4.4 仿真实验结果 |
2.5 HRRP数据预处理 |
2.5.1 归一化和迭代对齐 |
2.5.2 仿真实验结果 |
2.6 经典雷达HRRP目标识别模型 |
2.6.1 最大相关系数分类器模型 |
2.6.2 自适应高斯分类器模型 |
2.6.3 因子分析模型 |
2.6.4 复因子分析模型 |
2.6.5 仿真实验结果 |
2.7 卷积神经网络识别模型 |
2.7.1 神经元模型 |
2.7.2 前馈神经网络模型 |
2.7.3 卷积神经网络模型 |
2.8 本章小结 |
第三章 CPU和 GPU处理器的并行编程 |
3.1 CPU和 GPU硬件结构的异同 |
3.2 CPU多线程编程方法 |
3.3 GPU多线程编程框架 |
3.3.1 CUDA架构介绍 |
3.3.2 CUDA编程执行模型 |
3.4 CUDA编程调试及内核优化技巧 |
3.4.1 CUDA编程调试 |
3.4.2 CUDA内核优化技巧 |
3.5 本章小结 |
第四章 基于CPU和 GPU的 HRRP识别相关算法并行实现 |
4.1 引言 |
4.2 硬件平台与软件框架介绍 |
4.3 分段脉冲压缩算法并行实现 |
4.3.1 频域分段脉冲压缩并行结构分析 |
4.3.2 分段脉冲压缩CPU多线程并行实现 |
4.3.3 分段脉冲压缩GPU多线程并行实现 |
4.3.4 分段脉冲压缩并行实现结果 |
4.4 Keystone变换并行实现 |
4.4.1 Keystone变换并行结构分析 |
4.4.2 DFT+IFFT、Chirp-Z算法的CPU多线程并行实现 |
4.4.3 DFT+IFFT、Chirp-Z算法的GPU多线程并行实现 |
4.4.4 DFT+IFFT、Chirp-Z算法并行实现结果 |
4.4.5 运行时间与线程数的选择问题 |
4.5 迭代对齐并行实现 |
4.5.1 迭代对齐并行结构分析 |
4.5.2 迭代对齐CPU多线程并行实现 |
4.5.3 迭代对齐GPU多线程并行实现 |
4.5.4 迭代对齐并行实现结果 |
4.6 经典HRRP目标识别模型并行实现 |
4.6.1 MCC、AGC模型并行结构分析 |
4.6.2 MCC、AGC模型的CPU多线程并行实现 |
4.6.3 MCC、AGC模型的GPU多线程并行实现 |
4.6.4 MCC、AGC模型并行实现结果 |
4.6.5 FA、CFA模型并行结构分析 |
4.6.6 FA、CFA模型的CPU多线程并行实现 |
4.6.7 FA、CFA模型的GPU多线程并行实现 |
4.6.8 FA、CFA模型并行实现结果 |
4.7 均值方差解耦合的快速求法 |
4.7.1 CPU均值方差解耦合实现的性能分析 |
4.7.2 GPU均值方差解耦合实现的性能分析 |
4.8 卷积神经网络识别模型的并行实现 |
4.8.1 卷积神经网络模型并行结构分析 |
4.8.2 一维卷积神经网络并行实现 |
4.8.3 二维卷积神经网络并行实现 |
4.9 本章小结 |
第五章 总结与展望 |
5.1 工作总结 |
5.2 工作展望 |
参考文献 |
致谢 |
作者简介 |
(6)基于FPGA的输电线路缺陷智能识别(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 课题的研究背景及意义 |
1.2 基于图像的缺陷检测方法研究现状 |
1.2.1 目标识别方法研究现状 |
1.2.2 图像分割方法研究现状 |
1.2.3 缺陷检测方法研究现状 |
1.3 论文主要工作 |
第2章 缺陷智能检测基本原理 |
2.1 卷积神经网络的基础知识 |
2.1.1 卷积神经网络框架介绍 |
2.1.2 卷积神经网络的运算 |
2.2 数字图像处理的基础知识 |
2.2.1 直方图均衡化 |
2.2.2 图像分割 |
2.2.3 形态学滤波 |
2.2.4 .边缘检测 |
2.3 FPGA与图像处理 |
2.3.1 FPGA技术优势 |
2.3.2 FPGA开发流程 |
2.4 本章小结 |
第3章 基于卷积神经网络的目标识别 |
3.1 网络模型的搭建和训练 |
3.1.1 LeNet网络模型 |
3.1.2 网络模型的训练 |
3.1.3 网络模型的测试 |
3.2 卷积神经网络的并行性改进实现 |
3.2.1 网络框架并行运算的可行性 |
3.2.2 卷积层的并行性实现 |
3.2.3 池化层的并行性实现 |
3.2.4 全连接层的并行性实现 |
3.2.5 滑窗的实现 |
3.3 卷积神经网络的硬件加速实现 |
3.3.1 总体框架 |
3.3.2 图像转换模块 |
3.3.3 CNN计算单元 |
3.4 目标识别实验分析 |
3.4.1 实验平台 |
3.4.2 性能分析 |
3.5 本章小结 |
第4章 基于数字图像处理的缺陷检测 |
4.1 基于FPGA的直方图均衡化 |
4.1.1 直方图均衡化模块设计 |
4.1.2 直方图均衡化模块及效果 |
4.2 基于FPGA的图像分割 |
4.2.1 改进的局部自适应阈值分割算法 |
4.2.2 局部自适应阈值分割算法转换 |
4.2.3 局部自适应分割模块设计 |
4.2.4 局部自适应阈值分割模块及效果 |
4.3 基于FPGA的形态学滤波 |
4.3.1 形态学滤波的模块化设计 |
4.3.2 形态学滤波模块及效果 |
4.4 基于FPGA的边缘检测 |
4.4.1 图像平滑处理模块 |
4.4.2 Sobel算子模块设计 |
4.4.3 Cordic计算的基本原理及实现 |
4.4.4 边缘检测模块及效果 |
4.5 基于FPGA的缺陷检测 |
4.6 缺陷检测实验 |
4.6.1 实验平台 |
4.6.2 性能分析 |
4.7 本章小结 |
结论 |
参考文献 |
攻读硕士学位期间发表的论文和取得的科研成果 |
致谢 |
(7)基于CNN的SAR目标识别FPGA加速器设计(论文提纲范文)
摘要 |
ABSTRACT |
符号对照表 |
缩略语对照表 |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 SAR目标识别研究现状 |
1.3 深度学习研究现状 |
1.4 FPGA加速技术研究现状 |
1.5 论文结构安排 |
第二章 基于卷积神经网络的目标识别方法 |
2.1 卷积神经网络基本结构 |
2.2 卷积神经网络训练优化方法 |
2.2.1 训练方法 |
2.2.2 过拟合问题优化方法 |
2.3 基于候选区域方法的网络结构 |
2.3.1 R-CNN网络 |
2.3.2 Fast-RCNN网络 |
2.3.3 Faster-RCNN网络 |
2.4 本章小结 |
第三章 改进CNN/Faster-RCNN网络的SAR目标识别研究 |
3.1 基于改进CNN网络的SAR目标识别 |
3.1.1 改进的CNN网络模型 |
3.1.2 SAR数据集扩充 |
3.1.3 实验结果与分析 |
3.2 基于改进Faster-RCNN网络的SAR目标识别 |
3.2.1 改进的Faster-RCNN网络模型 |
3.2.2 多目标数据集扩充 |
3.2.3 实验结果与分析 |
3.3 本章小结 |
第四章 面向SAR目标识别的FPGA加速器设计 |
4.1 基于ZYNQ Ultra Scale+MPSo C的设计方法 |
4.1.1 ZYNQ Ultra Scale+MPSo C简介 |
4.1.2 硬件描述语言设计 |
4.1.3 高层次综合设计 |
4.1.4 软硬件协同设计 |
4.2 FPGA加速器总体框架设计 |
4.3 FPGA加速器子模块设计 |
4.3.1 卷积运算模块 |
4.3.2 激活函数模块 |
4.3.3 最大池化模块 |
4.3.4 Softmax分类器 |
4.4 加速器数据传输与缓存设计 |
4.4.1 PC与FPGA间数据传输 |
4.4.2 高速数据缓存设计 |
4.5 实验结果与分析 |
4.5.1 实验环境搭建 |
4.5.2 识别结果分析 |
4.5.3 加速器性能与识别效率分析 |
4.5.4 资源利用率与功耗分析 |
4.6 本章小结 |
第五章 总结与展望 |
5.1 论文总结 |
5.2 工作展望 |
参考文献 |
致谢 |
作者简介 |
(8)基于Zynq平台的水下目标识别关键技术研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 课题背景及研究的目的和意义 |
1.2 国内外研究现状 |
1.2.1 水下目标识别技术研究现状 |
1.2.2 卷积神经网络研究现状 |
1.2.3 卷积神经网络的FPGA加速研究现状 |
1.3 本文主要工作 |
第2章 相关理论与技术分析 |
2.1 模型分析 |
2.1.1 目标检测模型 |
2.1.2 MobileNet前向传播模型 |
2.2 MobileNet前向传播算法分析 |
2.2.1 标准卷积 |
2.2.2 深度卷积 |
2.2.3 点卷积 |
2.2.4 深度可分离卷积 |
2.2.5 批量归一化 |
2.2.6 RELU激活函数 |
2.2.7 Padding实现 |
2.3 量化策略和精度损失估计 |
2.3.1 卷积层量化策略 |
2.3.2 批量归一化层量化策略及参数处理 |
2.4 本章小结 |
第3章 并行计算方案及硬件加速设计 |
3.1 计算并行性分析 |
3.2 标准卷积并行化方案及硬件结构设计 |
3.2.1 标准卷积并行化方案 |
3.2.2 标准卷积硬件加速设计 |
3.2.3 归一化及RELU激活函数结构设计 |
3.3 深度卷积并行化方案及硬件结构设计 |
3.3.1 深度卷积并行化方案 |
3.3.2 深度卷积硬件加速设计 |
3.4 点卷积并行化方案及硬件加速设计 |
3.4.1 点卷积并行化方案 |
3.4.2 点卷积硬件加速设计 |
3.5 MobileNet层间运算并行方案 |
3.6 本章小结 |
第4章 基于ZYNQ平台的水下目标识别系统设计 |
4.1 系统架构方案 |
4.2 可配置性设计 |
4.2.1 可配置图像读入时序模块设计 |
4.2.2 可配置卷积数据读取模块设计 |
4.2.3 可配置权重读入时序控制模块设计 |
4.2.4 数据缓存裁剪模块设计 |
4.3 时序控制及不同压缩程度架构配置设计 |
4.4 本章小结 |
第5章 系统测试与分析 |
5.1 SSD MobileNet架构适应性测试 |
5.2 架构时序控制的优化 |
5.2.1 卷积层间串行计算为主的时序策略 |
5.2.2 卷积层间并行计算为主的时序策略 |
5.3 实验结果分析及比较 |
5.4 展望 |
5.5 本章小结 |
结论 |
参考文献 |
致谢 |
(9)基于区域卷积神经网络的光学遥感图像部分遮挡目标检测识别技术研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景与意义 |
1.2 研究现状 |
1.2.1 基于卷积神经网络的目标检测研究现状 |
1.2.2 光学遥感图像目标检测研究现状 |
1.3 论文的主要工作及内容安排 |
1.3.1 论文的主要工作 |
1.3.2 论文的内容安排 |
第二章 深度神经网络及其参数求解 |
2.1 引言 |
2.2 深度神经网络 |
2.2.1 DNN模型与前向传播过程 |
2.2.2 DNN网络参数求解之反向传播算法 |
2.2.3 DNN损失函数和激活函数的选择 |
2.3 卷积神经网络 |
2.3.1 CNN的模型结构 |
2.3.2 CNN前向传播算法 |
2.3.3 CNN反向传播算法 |
2.4 本章小结 |
第三章 基于全卷积网络结构和跳层连接的Fast RCNN |
3.1 引言 |
3.2 主干网络结构分析 |
3.2.1 全卷积网络结构对比 |
3.2.2 分类网络的输入与输出关系推导 |
3.3 卷积特征提取与分类网络 |
3.3.1 特征提取层中的跳层连接 |
3.3.2 卷积特征图上的分类网络 |
3.4 实验结果与分析 |
3.4.1 实验设置和评价标准 |
3.4.4 实验结果与分析 |
3.5 本章小结 |
第四章 基于TDM共享特征网络结构的光学遥感小目标检测 |
4.1 引言 |
4.2 Faster RCNN框架详解 |
4.2.1 RPN网络结构与anchors分析 |
4.2.2 理解边框回归 |
4.3 Top-Down特征融合网络结构 |
4.4 基于上下文区域的ROI Align |
4.4.1 ROI Pooling局限性分析 |
4.4.2 ROI Align主要思想和具体方法 |
4.4.3 ROI Align反向传播 |
4.4.4 基于上下文区域的ROI Align |
4.5 实验结果与分析 |
4.5.1 数据预处理 |
4.5.2 实验设置与结果分析 |
4.7 本章小结 |
第五章 基于聚集多层卷积特征的形变Faster RCNN的光学遥感部分遮挡目标检测 |
5.1 引言 |
5.2 形变卷积 |
5.3 排斥损失 |
5.4 随机覆盖算法 |
5.5 形变Faster RCNN框架 |
5.6 实验结果与分析 |
5.6.1 数据集 |
5.6.2 实验结果与分析 |
5.7 本章小结 |
第六章 结论与展望 |
6.1 论文总结 |
6.2 未来工作展望 |
致谢 |
参考文献 |
作者在学期间取得的学术成果 |
作者在学期间参与的科研项目 |
附录A CNN中感受野的计算 |
(10)基于Spark混合神经网络的手写字识别研究(论文提纲范文)
摘要 |
ABSTRACT |
1 绪论 |
1.1 研究背景 |
1.2 国内外的研究现状 |
1.2.1 卷积神经网络的发展现状 |
1.2.2 手写字应用现状 |
1.2.3 Apache Spark应用现状 |
1.3 卷积神经网络软硬件实现条件 |
1.4 研究的目的及意义 |
1.5 论文的创新点及组织结构 |
1.5.1 论文的创新点 |
1.5.2 论文的组织结构 |
2 神经网络 |
2.1 人工神经网络 |
2.1.1 单个神经网络 |
2.1.2 神经网络 |
2.1.3 多层感知机(MLP) |
2.1.4 反向传导算法 |
2.2 卷积神经网络 |
2.2.1 稀疏连接 |
2.2.2 权重共享 |
2.2.3 最大池采样 |
2.2.4 Softmax回归 |
2.2.5 卷积神经网络整体架构 |
2.3 本章小结 |
3 混合卷积神经网络在Spark上的实现 |
3.1 基于Spark混合卷积神经网络的工作原理和整体框架 |
3.1.1 基于Spark卷积神经网络并行性研究 |
3.1.2 基于Spark混合卷积神经网络的计算框架设计 |
3.1.3 CNN1+CNN2隐藏层设计 |
3.1.4 混合卷积网络运行原理 |
3.2 基于Spark混合卷积神经网络层内运行机制研究 |
3.2.1 单个输出的分布式架构 |
3.2.2 多个输出的分布式架构 |
3.2.3 分布式模型的参数选取 |
3.3 本章小结 |
4 基于Spark混合卷积神经网络手写字的识别 |
4.1 CNN网络整体架构 |
4.1.1 CNN网络整体架构详细设计 |
4.1.2 CNN卷积参数详细设计 |
4.1.3 实验步骤 |
4.1.4 CNN网络架构特征图选取 |
4.2 卷积神经网络相关参数和相应的格式 |
4.2.1 数值精度的运用和分析 |
4.2.2 卷积神经网络精度的合理选择 |
4.3 实验与分析 |
4.3.1 实验方案与设置 |
4.3.2 性能与分析 |
4.4 本章小结 |
5 总结和展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
攻读学位期间的主要学术成果 |
致谢 |
四、多CPU并行结构神经网络目标识别系统(论文参考文献)
- [1]基于深度学习的双孢菇采摘机器人视觉系统研究[D]. 曹景军. 中国农业科学院, 2021(01)
- [2]红外热成像图像中的人体行为检测技术研究[D]. 刘蒙. 长春理工大学, 2021(02)
- [3]基于机器视觉三维成像与卷积神经网络的目标识别研究[D]. 李思寒. 合肥工业大学, 2021(02)
- [4]多源信息融合多目标跟踪技术研究与设计[D]. 缪显涵. 电子科技大学, 2021(01)
- [5]基于CPU和GPU的雷达目标识别算法并行实现[D]. 钟银都. 西安电子科技大学, 2020(05)
- [6]基于FPGA的输电线路缺陷智能识别[D]. 王春宏. 哈尔滨工程大学, 2020(05)
- [7]基于CNN的SAR目标识别FPGA加速器设计[D]. 李昕卓. 西安电子科技大学, 2019(02)
- [8]基于Zynq平台的水下目标识别关键技术研究[D]. 何敏雅. 哈尔滨工业大学, 2018(02)
- [9]基于区域卷积神经网络的光学遥感图像部分遮挡目标检测识别技术研究[D]. 任云. 国防科技大学, 2018(01)
- [10]基于Spark混合神经网络的手写字识别研究[D]. 艾俊. 中南林业科技大学, 2016(04)