一、精细空间可伸缩视频编码方案实现(论文文献综述)
于越[1](2020)在《基于可伸缩编码的全景视频关键技术研究》文中认为VR(Virtual Reality)技术,即虚拟现实技术,是指一种创建和体验虚拟世界的计算机仿真技术。其中,全景视频(Panoramic Video)又被称为360。视频(360-degree Video),是当前VR技术的热门应用。为了提供沉浸式视频体验,全景视频由于其超高数据量和高交互的特点,要求高带宽和低时延的网络传输条件,对无线网络传输提出了巨大的挑战。因此,对于全景视频编码和传输技术的研究与优化,具有着重要的意义。本文将可伸缩编码(Scalable Video Coding,SVC)技术应用于空间分块的全景视频编码,研究基于可伸缩编码的全景视频编码与传输实现方案。针对全景视频的编码,设计可用于自适应传输的全景视频编码方案。针对全景视频的网络传输,设计自适应传输方案,对于空间分块的全景视频设计面向可伸缩编码的视频块调度方案和多级缓存框架。面向可伸缩编码的视频块调度与缓存策略,扩大了视点自适应方案的缓存长度上限,能够有效降低全景视频播放的卡顿频率,增强全景视频播放的流畅性,提供更好的用户体验质量。仿真结果表明,在视频播放流畅度等用户体验质量(Quality of Experience,QoE)指标上,相对于已有的全景视频传输方案,本文所提方案有明显的性能提升。在此基础上,本研究进一步研究全景视频用户体验的建模和预测方法,通过无线接入网中流式全景视频会话的建模,提出了一种有效预测用户QoE的方案,这为理解底层网络性能指标与全景视频用户体验质量之间的关系提供了参考。
孙朝辉[2](2020)在《SCMA网络中的可伸缩视频多播技术研究》文中研究表明随着第五代通信技术(5G)的不断发展,智能移动终端与大型屏幕设备日益普及,全球移动数据流量中视频流量的比例急剧增加,视频服务已逐渐成为移动通信互联网的主流业务。为满足海量的视频内容传输需求,实现超高容量与超低延迟等技术目标,设计第五代通信系统中的视频传输方案刻不容缓。基于非正交多址接入(Nonorthogonal Multiple Access,NOMA)技术的稀疏码多址接入(Sparse Code Multiple Access,SCMA)是一种具有显着赋形增益的码域非正交多路复用方案,在提升频谱效率的同时增加了用户接入点,因此成为5G技术的候选方案之一。同时,在视频编码传输领域,为适应日益多样化的终端设备与差异化的网络信道状况,可伸缩视频编解码技术应运而生。可伸缩视频编解码技术通过一次编码,得到多个不同码率与视觉质量的视频层。视频层可以分别进行传输,大大提高了传输灵活性与带宽利用率。目前功率域NOMA(Power Division based NOMA,PD-NOMA)网络下可伸缩视频多播技术已经有了广泛研究,但是面临着用户信道条件需要保证一定程度差异性的限制,而在SCMA网络下的视频传输技术还亟待开发。当前关于SCMA的研究主要集中于设计与改进码本模型,以求在增加用户接入点的同时降低解码时码本间的互相干扰。相比之下SCMA中的多播场景与视频传输领域的研究还十分匮乏。本文针对SCMA网络中可伸缩视频多播场景的高效传输问题,综合利用SCMA技术的码域非正交特性与可伸缩视频编解码的分层传输的特点,提出一种SCMA网络下的可伸缩视频多播方案,在有限的频谱与功率资源下提高了用户组整体的视觉性能。首先,通过建立SCMA网络下的视频多播模型提出了基于SCMA的可伸缩视频多播方案。其次,在建立模型时引入视觉感知质量(Quality of Experience,Qo E)指数作为优化目标,更直观的反映了用户的视觉质量增益。之后分析了码本分配与功率分配所造成的优化问题是一个复杂的离散混合分配问题,其相互依赖并共同影响信道容量,进而决定了多播组的总体视觉增益,所以造成了较高的复杂度。进一步地,提出了一种有效的快速资源分配方案,将码本分配与功率分配分离成两个阶段分步解决,在降低计算复杂度的同时获得了较好的性能。其中,对于视频码流存在一种或多种可伸缩维度的情况进行了分类讨论,引入了视频层选择与排序算法。最后,通过仿真结果表明,本文所提出的基于稀疏码多址接入网络的可伸缩视频传输方案相比于传统多播方案与基于正交频分复用技术的多播方案能为多播组用户提供更好的平均视觉质量,并在吞吐量、功耗性能方面获得提升。
李勇[3](2019)在《基于结构化稀疏表示的压缩视频采样》文中认为对信号进行采样和重建是信号处理领域最基本也是最核心的研究任务。传统的信号处理理论体系建立在香农等人的经典基础工作之上,遵循先采样,再压缩的过程。然而,由于奈奎斯特采样定理的要求,采样频率应不小于信号带宽的两倍才能保证不失真的信号重构,使得信号的采样值存在巨大的冗余。在随后的变换压缩过程中,再对变换后的系数进行大量的舍弃。这一系列过程不仅带来了巨大的计算和存储资源的浪费,也对硬件成本和传输带宽等因素带来了巨大的挑战。作为稀疏的一种应用,压缩感知是一种有效的信号采样和重构框架。压缩感知直接把待采样信号随机地投影到一个极低维空间中以获取采样数据,然后尝试通过获取该信号的稀疏表示来重建信号,实现了采样和压缩的同步融合,也以极大概率保证了信号的完美重构。因此,压缩感知降低了采样端对资源的要求,采样频率远远低于奈奎斯特采样频率,计算负担也被转移到了解码端。鉴于此,压缩感知被广泛的应用于全息成像、医学成像、卫星多光谱成像、雷达成像等各种成像技术,图像视频处理、传感网络以及信道编码等领域。然而,传统的压缩感知理论是建立在一般性稀疏的假设前提下,对于高维信号的采样和重构,无法有效利用其内在的结构化信息。因此,如何获取结构化的稀疏表示和信号内在的结构化信息对高维信号的采样重建性能至关重要。本文的主要研究内容为基于结构化稀疏表示的压缩视频采样。本文利用数据驱动子空间联合模型,该模型基于视频信号内的空时结构进行结构化稀疏表示,可实现高效压缩采样。该联合模型具有泛化性和可伸缩性,能够适用线性和多线性子空间学习,同时支持信号的渐进表示。本文的主要创新点包括以下几个方面:本文提出了一种泛化的数据驱动子空间联合模型,该模型可自适应性的分解信号以获取结构化的稀疏表示。该方法的主要贡献在于以下两个方面。首先,我们对已采样信号,利用子空间聚类得到各个子空间最优的结构信息和基矩阵。对于内含多种统计特性的多维信号,该模型可提供线性和多线性子空间学习的方法用于压缩感知基矩阵的学习。作为一般性的压缩感知模型的一种改进,这种用于信号稀疏性的基是通过线性子空间学习方法自适应得到的。其次,为了避免对高维信号向量化操作带来的存储和计算问题,我们考虑利用更加泛化的基于张量的压缩感知模型,该模型采用了多线性子空间学习的方法用于自适应学习出张量信号的稀疏表示基矩阵。我们提出的数据驱动子空间联合模型在一定的重建质量要求下需要更少的自由度。实验结果表明我们的模型用于压缩视频采样更加有效。本文提出了一种块稀疏子空间学习框架,引入结构化稀疏约束进一步优化数据驱动子空间联合模型,获得广义块稀疏表示用于压缩视频采样。该方法克服了子空间联合模型由于子空间关联无法获得块稀疏的问题。我们利用块相关性最小化来消除子空间之间的交集进而提升了基于数据驱动子空间联合的块稀疏表示。我们设计的这种块相关约束下的正则化学习进一步优化子空间联合学习的结构以及独立基矩阵。在块约束等距特性的假设下,我们证明了对于相互正交的子空间下的最优块稀疏表示是可以得到,并给出稳定重构的保证条件。更进一步,尤其针对内含变化不平稳统计性的多维信号,我们提出的框架可进一步利用克罗内克积进而可被推广处理张量信号。实验结果表明我们的框架用于压缩视频采样可获得更高的稳定性和效率。本文提出了一种新型的可伸缩结构化压缩视频采样框架,通过分层子空间学习来实现在异构网络条件下的视频传输。首先,我们所提出的框架结合了数据驱动子空间联合模型,将结构化稀疏性引入感知矩阵,用于采样测量的渐进获取。进一步的,我们设计了分层子空间学习,其基于自适应子空间聚类以渐进的方式生成子空间和对应的基。这样,我们可以得到两种分层结构以分别实现子空间和基矩阵到结构化感知矩阵的渐进映射从而实现质量可伸缩性。为了保证分层子空间学习的收敛,我们利用重建的参考帧中的自适应组集来更新训练集。此外,我们证明了,在块限制等距特性(RIP)的约束下,本文提出的可伸缩结构化压缩视频采样算法可以保证每个质量层的稳定恢复。最后,我们把所提出的模型推广到张量子空间中,用于高维信号的可伸缩压缩采样。实验结果表明,与现有的质量可伸缩压缩视频采样方法相比,所提出的算法可以得到更佳的重建性能。本文提出了大尺度优化问题的可分解迭代算法,通过把高维优化问题分解成多个子问题进行迭代求解,实现了优化算法的分布式和加速运算。首先,我们考虑针对大尺度优化的对偶优化算法,通过Legendre变换把主问题转化成对偶问题进行迭代求解。基于此,我们设计了一种基于垂直网格分解的Newton-Raphson迭代算法用以逻辑回归(logistic regression)。该算法通过把数据进行垂直分布式划分,利用核方法及NewtonRaphson迭代算法,把逻辑回归主问题转换成对偶问题进行分布式优化计算,不仅降低模型训练的复杂度还可应用于隐私保护联邦数据分析的场景。进一步的,考虑上述基于对偶分解的Newton-Raphson迭代算法对于优化函数要求Legendre条件需满足最优点的存在性,我们进一步提出基于交替方向乘子法的可分解优化算法,并应用于基于结构化稀疏的约束优化问题中,进一步提高在自适应克罗内克基下的稀疏张量表示的重构性能。实验结果表明我们提出的方法优于已有最先进的方法。
余唱[4](2018)在《可伸缩视频编码标准SHVC的低复杂度编码技术研究》文中研究表明视频已经成为人们日常工作、生活中获取信息、传递信息的主要途径。视频信息庞大的数据量导致传输数据过多地消耗了时间,而且网络的异构、终端的差异等因素也使得前几代面向存储和电路交换的可伸缩视频压缩编码标准很难满足现代IP网络,特别是无线网络的实时传输需求。为此,高效可伸缩视频编码H.265/SHVC标准应运而生。SHVC标准是高效视频编码标准(High Efficiency Video Coding,HEVC)的可伸缩扩展,在继承了HEVC编码的高效性的同时,先进技术的引用极大地增加了SHVC标准的编码复杂度。针对SHVC标准的帧内预测和帧间预测编码计算量大,速度慢的缺点,本文提出两种帧内预测快速算法以及一种帧间预测快速算法,从而大幅降低SHVC标准的计算复杂度,节省了编码时间,为SHVC标准实现实时编码提供了可能性。本文的主要内容为:首先,本文为空间可伸缩SHVC标准提出了一种适用于增强层帧内预测的编码单元(Coding Unit,CU)编码深度决策快速算法。本算法首先利用编码树单元(Coding Tree Unit,CTU)的交流系数能量对图像的纹理复杂度进行分类,为纹理复杂度简单和复杂的CTU分别初步去除采纳可能性较低的编码深度。对于纹理复杂度介于简单与复杂之间的CTU,利用基本层与增强层之间在编码深度上的相关性为其预测一个缩小的编码深度范围。其次,利用编码深度在同一增强层的空间相邻CU之间的相关性,对初步缩小的编码深度范围作进一步的限制,以提前终止CU划分处理过程。相比于SHM原始算法,本算法最多可节省约52%的编码时间,同时仅引起极低的码率增加(0.89%),峰值信噪比的平均下降也可忽略不计(0.03d B)。其次,本文针对空间可伸缩SHVC标准提出了一种适用于增强层帧内预测的编码模式决策快速算法。本算法充分利用先验知识,有选择性地对帧内编码模式在时间、空间和层间存在的相关性进行结合,为不同尺寸的预测单元(Prediction Unit,PU)分别构造初始候选编码模式列表,减少需要执行粗略模式决策(Rough Mode Decision,RMD)的编码模式数量。另外,本算法还对RMD之后的编码过程进行了优化。通过比较RMD过程筛选出的编码模式的哈达玛(Hadamard)变换代价值,去除代价值较大的编码模式,从而进一步减少了候选编码模式的个数,降低了编码计算量。相比于SHM原始算法,本算法可将编码时间缩短为原来的80%,同时带来的码率增加仅为0.98%,峰值信噪比的下降也仅为0.06d B。此外,本文还将空间可伸缩SHVC标准的增强层帧内预测CU编码深度决策算法与帧内编码模式决策算法整合成为SHVC增强层帧内预测快速算法。实验证明,对于所有类型的测试视频,整合后的快速算法可以实现平均40%的时间节省,而损失的PSNR值仅为0.08d B,平均增加的码率不超过1.6%。最后,本文针对空间可伸缩SHVC标准提出了一种适用于增强层帧间预测的PU划分模式决策快速算法。本算法利用PU划分模式在基本层与增强层之间的相关性,为增强层当前PU预测出最有可能的几种PU划分模式,减少编码增强层时当前CU需计算率失真代价值的划分模式的个数。对于基本层中采用2N×2N模式进行PU划分的CU,在编码其位于增强层中的同位CU时,本算法综合考虑了增强层图像的尺寸、增强层当前CU的编码深度以及基本层同位CU的运动复杂度,并对不同情况分别提出解决方案,在避免了不必要计算的同时,确保了预测的准确性。实验结果证明,相比于SHM原始的帧间预测算法,在编码器采用Lowdelay配置时,本算法实现了平均36.3%的编码时间节省,同时增加极少的编码码率,BDPSNR的下降低于0.1d B。
宋晓丹[5](2017)在《面向云移动媒体计算的图像视频通信和存储技术研究》文中研究表明移动设备的普及和无线通信技术的发展极大的改善了用户的多媒体体验。但是移动设备资源受限和无线信道的时变特点限制了其进一步发展。幸运的是,云计算中丰富的计算资源刚好提供了一种降低移动端负载的方案,也因此兴起一个新的研究领域——云移动媒体计算。它给图像视频通信技术和存储带来新的机遇和挑战。首先,云端丰富的数据资源使得找到与给定图像具有相似内容的图片非常容易,尤其是地标建筑图片。但是传统的图像编码方法(比如JPEG)无法利用这样的外部相关性。基于视觉的方法通过局部描述子能够利用云端的相似图片,但是难以保证像素级别保真度。其次,无线信道信噪比和带宽的时变特点限制了通信带宽。现有的传输方案无法在一个统一的框架中解决信道信噪比和带宽可伸缩性问题,且无法利用云端的相似图像提高传输效率。最后,为了保证云端数据的可靠存储必须引入冗余。但是云存储中频繁出现的错误要求降低恢复数据的代价。由于视频占用空间大以及视频分享和视频点播的风靡,视频占了云端所有数据中的一大部分。然而现有的云端冗余保护方案将所有数据视为一般数据,任一一个比特发生错误将导致文件发生永久损坏。视频不同于一般类型,能够忍受一定程度的质量损失。为了解决以上问题,本论文重点研究如何在保证低编码复杂度和高像素级别保真度的前提下利用云端的海量图像帮助提高图像编码效率;强调如何在统一框架中应对无线图像传输中的信道信噪比和带宽可伸缩性,且利用云端的相似图像问题;探索如何在云存储冗余保护中利用视频的独有特点如可伸缩性表达,在可靠性,存储代价和恢复代价三者之间获得更好的折衷。本论文的主要研究内容和贡献分为以下三部分:第一部分工作针对云移动媒体计算中的照片分享或者上传问题,尝试以保持低编码复杂度和高像素级保真度为前提利用云端相似图像,并提出一种基于海量图像的分布式图像编码方案。对于每一幅输入图像,我们首先传输一幅下采样小图到云端,解码端解码之后用于搜索相似场景下的相关图像并采用类似于基于云的超分辨图像重建方法经过几何对齐和光照校正后得到较高质量的重建图像。该重建图像作为我们方案中分布式编码部分的边信息。为了纠正边信息和输入图像之间的不同,我们使用频域内基于位平面的校验子编码对输入图像进行压缩。云端每收到一个位平面,我们在最终重建和边信息间进行迭代精细化运算以提高边信息和当前分布式编码重建图像的质量。此外,为了适应不同程度的相关性,我们提出一种图像块,频带和位平面级别的编码端和解码端联合模式决策技术。在地标图像数据库中,我们的方案在主观和客观质量两方面均有很大的提高。和带有算数编码的JPEG方案相比较,具有高达5 dB的客观质量提高和70%的码率节省;低码率情况下,我们的方案和最新的HEVC编码方案具有相当的性能,且更低的编码复杂度。第二部分工作我们考虑云移动媒体计算中无线时变信道的高效图像传输问题,提出一种新颖的利用云端相似图像的分布式压缩感知图像无线传输方案。其特点在于能够在统一的框架中既利用云端相似图像,同时具有低编码复杂度,信道信噪比和带宽可伸缩性的特点。由输入图像产生的下采样小图经过压缩,前向错误纠正保护和调制首先传输到接收端,用以搜索云端的相似图像并生成边信息。输入图像减去小图的上采样图像后的残差直接通过压缩感知进行随机观测,观测值跳过前向纠错编码直接经过高密度的星座图调制传输到解码端。未经过编码的观测值和压缩感知线性随机观测特性使得其自然地在不需要改变编码框架的前提下具有信噪比和带宽可伸缩性的特性。为了更好的利用带宽和更具有鲁棒性,观测之前我们引入了模式决策和频域内的能量分配。在接收端,为了恢复残差信号,我们提出两阶段的分布式压缩感知解码算法同时利用了图像内部及和与边信息间的局部和非局部相关性。在地标建筑数据库和高斯白噪声信道中的仿真结果显示,重建图像质量具有信道信噪比和带宽可伸缩性。此外,和现有的模拟编码方案SoftCast相比较,我们的方案的客观质量具有高达11 dB性能提高,主观质量上也有很大的提高。第三部分工作针对云存储中基本的视频存储问题,我们利用多层视频表达(如可伸缩视频和联播码流)的特点,提出一种面向云存储的可伸缩视频非均匀保护存储方案。以微软云存储系统现在采用的局部重建保护码字为例,通过给不太重要的层或者视频备份引入更少的保护,能够在存储代价和恢复代价之间取得更好的均衡。理论结果和仿真结果均显示,和局部可重建码字均匀编码方案相比较,我们的方案能够达到更好的折衷,尽管在很少的情况下视频质量有所降低。
李礼[6](2016)在《面向高性能视频编码的码率控制与仿射预测研究》文中研究指明在视频采集设备和显示设备都呈日新月异发展的大背景下,处于视频传输中间阶段的视频编码技术正面临着越来越大的压力,面向高清视频的最新一代视频编码标准高性能视频编码(High Efficiency Video Coding, HEVC)相比前一代编码标准H.264/AVC在相同的主观质量下可以带来一半的码率节省,可以一定程度上缓解视频编码面临的压力,但是针对目前的需求仍然远远不够,如何在高性能视频编码的基础上充分利用带宽以及进一步提高编码性能是目前面临的关键挑战。一般来说,最优的比特分配以及精确的码率控制是实现带宽有效利用的关键技术。大多数的传统方法都是基于量化参数来进行码率控制和比特分配,但是由于在HEVC中,头信息所占的比特数大幅度增加,所以基于量化参数的传统方法并不适合于HEVC。最新涌现出来了一种基于拉格朗日常数入的码率控制方法可以很精确的控制码率,但是目前并没有最优的比特分配方法与之相匹配,而且对于高性能视频编码可伸缩扩展是否适用也需要仔细研究。另外,从编码性能的角度,在高性能视频编码中也仅仅使用了平移运动模型,所以最新的视频编码标准也仍然无法有效的刻画非常复杂的运动,而复杂的运动又往往是视频中最消耗比特数的部分,因此在高清视频编码上如何有效的引入更高阶的运动模型以更好的刻画复杂运动同样也是非常关键的一个问题。大多数传统的高阶运动模型方法都无法在编码性能以及编解码复杂度这两方面找到一个平衡,所以高阶运动模型迟迟没有进入视频编码标准的范畴。本文试图从以上两个方面进一步提升有限带宽下的视频质量。一方面尽量在HEVC尽量实现最优的比特分配和精确的码率控制,以实现带宽的更有效利用,另一方面引入高阶运动模型实现视频中复杂运动的更好刻画,以进一步提高编码效率。论文的主要工作和创新如下:(1)本文针对HEVC的λ域码率控制方法提出了一种最优比特分配方案。首先,本文提出了一个完整的λ域R-D分析框架,除了现有工作中的R-λ模型用来表示R和λ之间的关系,本章提出了一个全新的D-λ模型来表示D和λ之间的关系。其次,本文基于此完整的λ域R-D分析框架和基本的R-D优化理论提出了一种与内容相关的最优图片级比特分配算法。再次,本文基于完整的λ域R-D分析框架和基本的R-D优化理论同时提出了与内容相关的基本单元级比特分配算法。实验结果表明,本文提出的为HEVC设计的最优比特方案相比传统方法可以实现明显率失真性能提升。本文提出的图片级以及基本单元级比特分配算法被国际标准化组织JCT-VC接受且集成进入了HEVC参考软件。(2)本文针对HEVC可伸缩扩展提出了一种最优的码率控制方案。首先,本文为可伸缩视频编码每一层的第一帧提出了一种最优的初始目标比特数以及初始编码参数决定算法以实现更好的R-D性能。其次,本文基于根本的率失真优化理论联合考虑层内和层间的依赖关系为空间和质量可伸缩的帧间图片设计了一种最优比特分配算法。最后,本文提出了一个针对R-λ模型的自适应更新算法来精确的估计码率控制模型参数以实现更好的码率控制精度。实验结果表明,本文提出的为HEVC可伸缩扩展设计的码率控制方案相比传统方法可以在精确的码率控制下显着提高率失真性能。(3)本文针对HEVC提出了一种低复杂度仿射运动补偿框架以更好的刻画复杂运动。首先,本文提出了一个支持多参考帧的四参数仿射运动补偿框架。其次,本文提出了两种决定仿射运动矢量的方式:先进的仿射运动矢量预测模式以及仿射模型融合模式:特别地,与先进的仿射运动矢量预测模式相结合,提出了一种基于梯度下降的快速仿射运动估计算法。最后,本文提出了两个工具以减少复杂的仿射运动补偿带来的编解码复杂度,其中一个是一步子像素插值滤波器用于减少插值分像素需要的插值次数;另一个是基于仿射插值精度的自适应块大小运动补偿用于尽量提高运动补偿块的大小从而减小运动补偿的复杂度。实验结果表明,本文提出的仿射运动预测技术可以显着提高包含旋转和缩放等复杂运动的视频的编码性能。本章提出的仿射运动补偿框架被集成进入JEM参考软件。
黎洪松,程福林,艾新宇[7](2016)在《视频编码技术的若干新进展》文中研究表明对数字视频编码技术的新进展进行了综述。先对传统视频编码方法进行了分析,指出其存在的不足;然后对基于压缩感知理论的视频编码、分布式视频编码、基于视觉特性的视频编码和可分级视频编码这四种视频编码技术的新进展进行了介绍;最后对未来可能的发展方向进行了展望,可为视频编码技术的相关研究提供参考。
吴刚[8](2014)在《基于HEVC标准的可伸缩视频编码技术研究》文中研究指明随着视频信息的日益普及和视频应用的广泛传播,视频编码技术在近些年来取得了很好的发展。在这样的背景下,由于Internet固有的网络异构性、用户终端设备的处理能力和显示能力不尽相同,也给多媒体信息的广泛传播和应用带来了巨大挑战。为应对这一挑战,可伸缩视频编码(Scalable Video Coding, SVC)技术因其能很好的解决这些问题而得到广泛研究。作为新一代视频编码国际标准HEVC(HighEfficiencyVideoCoding),在ITU-T的VCEG和ISO/IEC的MPEG通力合作下已经制定成功并于2013年1月颁布。HEVC依然采用混合编码框架,并提供了多种先进编码技术。其目标是在相同的视觉质量下,编码效率要比现行的H.264/AVC标准节省约50%的码率。本文紧跟HEVC标准框架,针对HEVC扩展下的高效可伸缩视频编码(SHVC),跟踪研究了JCT-VC在研SHVC标准及其特点,设计了相关的软件测试平台,并提出一系列改进方案以提高增强层编码效率。质量可伸缩性(Quality Scalability)的基本层与增强层有着相同的视频分辨率和帧率,不同的是基本层与增强层的量化参数设置不同,以达到视觉质量上的可伸缩。基本层仍然按照标准HEVC进行编码,对于增强层,其最重要也是最突出的特点在于充分利用基本层已编码的信息来指导增强层,称之为层间预测。这种层间预测机制可以使增强层预测更准确,从而使编码效率得到较大提高。本文通过对层间预测机制的深入研究,提出了多种层间预测方案,包括层间纹理预测模式,层间运动信息预测等等,在基本不增加编码复杂度的情况下,提高了编码效率。空间可伸缩性(Spatial Scalability)是将不同分辨率的视频分别作为基本层和增强层输入。空间可伸缩编码方式和质量可伸缩编码基本类似,同样需要采用层间预测机制来提高增强层编码效率。区别在于要对基本层重建信息进行上采样,所以空间可伸缩编码中层间预测机制较为丰富,常常需要辅助以层间滤波技术来减少这种误差损失。本文针对空间可伸缩编码层间预测的特殊性,进行了相当规模的算法实验和优化,最后,我们针对空间可伸缩视频编码提出了若干个层间预测方案,包括自适应联合加权预测、自适应层间滤波器等技术,编码效率取得了一定的提升。此外,本文还对不断变化中的HEVC以及SHVC进行概要性的研究,上述各种改进工作正是基于这些研究。
石中博[9](2014)在《基于内容分析的图像视频编码研究》文中指出数字图像视频的压缩技术已经研究超过二十年,并取得了巨大的成功。然而,多年的开发使得以“预测-变换”为主的传统编码框架越来越接近其性能极限。我们有必要从新的角度分析并理解数字图像视觉内容,开发新的编码压缩方法。最近十年中,计算机视觉领域的快速发展启发我们可以从视觉内容分析出发,发掘图像的视觉相关性,改进图像视频编码性能。在本论文中,我们重点研究视觉内容分析技术与图像视频编码技术的结合,借助视觉内容分析技术对图像间视觉相关性进行分析,消除图像和视频中不同层面的视觉冗余,从而提高图像视频的编码效率。本论文的主要贡献可以总结为三个部分的工作。在第一部分工作中,我们提出了一种基于视觉模式分析的图像编码方法。该方法通过先验视觉模式描述图像低频和高频之间的视觉相关性,并由此自适应地在编码端丢弃图像中的某些高频视觉冗余,改善编码性能。同时在解码端,根据视觉模式包含的先验信息估计并恢复丢失的高频细节,改善图像重建质量。此外,我们进一步地将基于视觉模式的分析技术扩展至可伸缩视频编码应用,提出了一种新的基于视觉模式分析的层间预测方法。该方法借助视觉模式的搜索和映射,同时发掘可伸缩视频序列在时域和空域的视觉相关性,分别生成两个高质量的层间预测信号,改善可伸缩视频编码性能。此外,我们还采用了基于参数分析的预测方法,通过分析基本层已编码的信息(比如HEVC编码中的四叉树信息)来实现复杂度较低的层间预测。我们的方法通过结合多种内容分析机制,同时提供了多环路和单环路的系统实现,在编码性能和复杂度之间取得更好的平衡。在第二部分的工作中,我们提出了一种基于图像特征的高效图像编码方法。该方法通过图像局部特征匹配建立起更紧密的图像局部视觉联系,再配合像素层面的相关性分析,更有效地消除视觉冗余。具体地说,我们利用多尺度小波变换和SIFT特征提取,首先将输入图像分解为全局信息和子带内局部信息,并进行编码压缩。全局信息是对输入图像的基本描述,包含有限的视觉冗余;而子带内局部信息则是从不同的小波子带中提取的SIFT局部特征。在解码端,我们利用解码的SIFT特征从云端图像数据库中,检索出一组视觉相似的图像片。然后,结合基于视觉模式的分析和映射,将这些相似图像片中的信息与解码的全局信息融合起来,重建目标图像。根据子带内SIFT特征建立的视觉联系,我们利用基于视觉模式的映射从最低频的子带开始,由低频至高频,依次将视觉相似图像片内的信息融合进入对应的子带,恢复图像不同频带内的局部细节,直到图像完整重建。我们的方法通过结合局部特征分析技术和视觉模式分析的优点,取得更高效的图像编码性能。在第三部分的工作中,我们提出一种基于图像特征全局相似度分析的图像集整体优化编码方法。根据图像局部特征的整体统计特性,我们定义特征距离来分析图像与图像间的全局相似度。在此基础上,我们将图像集聚类为若干个相关性更强的子集,并将每个子集中图像间的关系描述为一个加权有向图。图中每个节点代表一幅图像,每一条边由特征距离加权。通过寻找该有向图的最小权值生成树,可以得到具有最小预测代价的优化编码结构。为了进一步增强图与图之间的相关性,我们提出了一种全新的基于特征的图像间三步预测方法。首先,我们利用SIFT特征匹配和多模型几何运动估计,消除不同区域的几何形变。其次,我们引入光度变换消除图像间由于光照变化带来的差异。最后,我们利用基于块的运动补偿机制生成局部优化的预测信号。我们提出的基于图像特征的方法充分利用多种内容分析技术的优点。基于特征的全局分析技术有效地确定了优化编码结构;基于局部特征匹配的图像变换增强了图像与图像间的区域相关性;基于像素的运动补偿生成了更精确的预测信号。因此,我们的方法有效地发掘了相关图像间的视觉冗余,提高了图像集整体编码的效率,同时为进一步研究大数据和云存储环境中的大尺度图像视频编码提供了新的思路。
张卓良[10](2014)在《小波变换在可伸缩性视频编码中的应用》文中研究说明异构网络给传统视频编码技术提出了新的挑战。因为传统视频编码码流不具有灵活的码率调节或仅有有限的码率调节功能,难以满足异构网复杂多变的情况,所以国际标准化组织和动态图像专家组提出了可伸缩性视频编码的国际标准,用于解决异构网中带宽变化、终端不同而造成的一系列问题。在可伸缩性视频编码标准的制定过程中,小波变换因未能带来与其复杂度匹配的性能,而没有被国际标准所采纳。但是因为它具有多分辨率特性,一直以来被认为是实现可伸缩性视频编码的理想工具,关于它的研究也一直在继续。其中有从生成信号/子带角度提出的STP(Spatio-Temporal subbands Prediction)工具方案作为基于小波变换的可伸缩性视频编码框架,以及用于实现运动补偿时域滤波的杠铃提升机制,都为解决运动补偿中分数像素精度映射和多对多映射时遇到的问题提出了很好的解决方案。本文基于杠铃提升方案,给出了一种改进的杠铃函数和两种临近像素方案,并提出了与之配套的权重分配方案,以对该杠铃提升机制加以实现,并将其应用于基于小波的可伸缩性视频编码器。在具体的实现中;为了兼顾编码效率和杠铃提升的性能,采用了宏块级别的加权系数方案和帧级别的临近像素方案,实现了较好的压缩性能和可伸缩性。
二、精细空间可伸缩视频编码方案实现(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、精细空间可伸缩视频编码方案实现(论文提纲范文)
(1)基于可伸缩编码的全景视频关键技术研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景与意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 国内外研究现状 |
1.3 研究内容与章节安排 |
第二章 全景视频技术基础 |
2.1 全景视频技术概述 |
2.2 用户视口 |
2.3 动态自适应流媒体传输协议 |
2.4 全景视频质量评价 |
2.5 视频可伸缩编码 |
2.6 本章小结 |
第三章 基于可伸缩编码的全景视频自适应传输方案 |
3.1 全景视频编码和自适应传输方案 |
3.1.1 方案概述 |
3.1.2 基于可伸缩编码的视频编码方案 |
3.1.3 基于多级缓存的全景视频客户端设计 |
3.2 仿真实验 |
3.2.1 仿真系统介绍 |
3.2.2 仿真环境 |
3.2.3 仿真结果与分析 |
3.3 本章小结 |
第四章 全景视频体验质量预测 |
4.1 体验质量预测方案 |
4.1.1 预测方案 |
4.1.2 全景视频体验质量建模 |
4.1.3 无线接入网中全景视频流的建模 |
4.2 仿真实验与结果分析 |
4.3 本章小结 |
第五章 总结与展望 |
5.1 本文总结 |
5.2 未来工作展望 |
参考文献 |
致谢 |
攻读学位期间发表的学术论文 |
(2)SCMA网络中的可伸缩视频多播技术研究(论文提纲范文)
摘要 |
ABSTRACT |
符号对照表 |
缩略语对照表 |
第一章 绪论 |
1.1 论文研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 可伸缩视频多播研究现状 |
1.2.2 SCMA资源分配研究现状 |
1.3 论文主要内容及结构安排 |
第二章 SCMA网络与SVC技术基础 |
2.1 QoE视觉评价模型 |
2.2 SVC编码技术概述 |
2.3 SCMA技术基本原理 |
2.4 本章小结 |
第三章 基于SCMA的 SVC多播资源分配研究 |
3.1 引言 |
3.2 系统模型 |
3.3 基于SCMA的 SVC多播方案 |
3.3.1 优化问题建立 |
3.3.2 方案复杂度分析 |
3.4 码本分配方案 |
3.4.1 传输一种可伸缩视频流的码本分配 |
3.4.2 传输混合可伸缩视频流的码本分配 |
3.5 功率分配方案 |
3.6 本章小结 |
第四章 仿真结果与性能分析 |
4.1 对比模型与仿真参数设置 |
4.1.1 对比模型与场景 |
4.1.2 仿真参数设置 |
4.2 SCMA网络可伸缩视频多播方案传输性能分析 |
4.2.1 用户分布范围对QoE性能影响分析 |
4.2.2 用户分布范围对吞吐量性能影响分析 |
4.2.3 功率对QoE性能影响分析 |
4.3 前向排序与后向排序算法性能分析 |
4.3.1 用户分布范围对QoE性能影响分析 |
4.3.2 功率对QoE性能影响分析 |
4.4 本章小结 |
第五章 总结与展望 |
5.1 论文工作总结 |
5.2 后续工作展望 |
参考文献 |
致谢 |
作者简介 |
(3)基于结构化稀疏表示的压缩视频采样(论文提纲范文)
摘要 |
abstract |
缩略语 |
第一章 绪论 |
1.1 研究背景 |
1.2 研究现状及难点 |
1.3 主要研究内容和文章结构 |
1.4 主要创新点 |
第二章 背景知识 |
2.1 引言 |
2.2 稀疏表示 |
2.2.1 一般性稀疏 |
2.2.2 结构化稀疏 |
2.3 采样矩阵的设计 |
2.4 CS重构算法 |
2.4.1 基于一般性稀疏的重构算法 |
2.4.2 基于结构化稀疏的重构算法 |
2.5 基于端到端的压缩感知 |
2.6 可伸缩视频编码 |
第三章 压缩视频采样:数据驱动子空间联合模型 |
3.1 前言 |
3.2 压缩视频采样技术概述 |
3.2.1 向量化的压缩视频采样技术概述 |
3.2.2 张量化的压缩视频采样技术概述 |
3.3 背景和驱动 |
3.3.1 单子空间模型 |
3.3.2 子空间联合模型 |
3.3.3 问题驱动 |
3.4 基于数据驱动子空间联合模型的压缩视频采样框架 |
3.4.1 框架描述 |
3.4.2 子空间聚类 |
3.4.3 线性子空间学习 |
3.4.4 稳定重构 |
3.5 UoDS模型的张量推广 |
3.5.1 广义问题陈述 |
3.5.2 稳定重构 |
3.5.3 基于广义模型的压缩视频采样框架 |
3.6 实验结果 |
3.6.1 实验设置 |
3.6.2 线性子空间结果 |
3.6.3 多线性子空间结果 |
3.6.4 计算复杂度 |
3.7 小结 |
第四章 压缩视频采样:块稀疏子空间学习框架 |
4.1 前言 |
4.2 背景及驱动 |
4.3 最优结构化稀疏表示 |
4.3.1 数据驱动的张量子空间联合模型 |
4.3.2 块稀疏下的最优性 |
4.4 结构化稀疏约束优化 |
4.4.1 块稀疏子空间学习 |
4.4.2 泛化的块稀疏子空间学习 |
4.5 实验结果 |
4.5.1 实验设置 |
4.5.2 线性子空间学习:BSSL |
4.5.3 张量子空间学习:UoTS和 GBSSL |
4.5.4 计算复杂度 |
4.6 本章小结 |
第五章 结构化稀疏可伸缩压缩视频采样方法 |
5.1 前言 |
5.2 背景及驱动 |
5.3 结构化稀疏可伸缩压缩视频采样方法(SS-CVS) |
5.3.1 框架描述 |
5.3.2 可伸缩的压缩感知 |
5.3.3 稳定的可伸缩重构 |
5.4 质量可伸缩性:分层子空间学习 |
5.4.1 子空间聚类的层次结构 |
5.4.2 基矩阵派生的层次结构 |
5.4.3 基于块稀疏张量的SS-CVS(BT-SS-CVS) |
5.5 实验 |
5.5.1 实验设置 |
5.5.2 结构化稀疏可伸缩视频采样:分层子空间学习 |
5.5.3 基于张量的扩展:BT-SS-CVS |
5.5.4 计算复杂度 |
5.6 本章小结 |
第六章 大尺度优化问题的可分解迭代算法 |
6.1 前言 |
6.2 背景及驱动 |
6.2.1 联邦数据分析 |
6.2.2 二元逻辑回归 |
6.3 垂直网格逻辑回归学习 |
6.3.1 逻辑回归对偶优化问题的牛顿迭代算法 |
6.3.2 垂直网格逻辑回归学习 |
6.3.3 基于固定海森矩阵的垂直网格逻辑回归 |
6.4 块稀疏张量的交替方向乘子法 |
6.5 实验 |
6.5.1 实验:垂直网格逻辑回归算法 |
6.5.2 实验:块稀疏张量的交替方向乘子法 |
6.6 本章小结 |
第七章 总结和展望 |
7.1 全文总结 |
7.2 未来工作展望 |
附录 A附录A定理3.3 的证明 |
参考文献 |
致谢 |
攻读学位期间发表的学术论文 |
攻读学位期间参与的项目 |
攻读学位期间申请的专利 |
(4)可伸缩视频编码标准SHVC的低复杂度编码技术研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 课题研究背景 |
1.2 课题研究目的和意义 |
1.3 SHVC标准低复杂度编码技术的国内外研究现状 |
1.3.1 SHVC标准帧内预测快速算法的研究现状 |
1.3.2 SHVC标准帧间预测快速算法的研究现状 |
1.4 可伸缩视频编码国际标准的发展历程 |
1.5 本文主要研究内容及组织结构 |
第2章 SHVC标准关键技术分析 |
2.1 SHVC标准的编码框架 |
2.2 SHVC标准的关键技术 |
2.2.1 帧内预测 |
2.2.2 帧间预测 |
2.3 SHVC标准的编码结构 |
2.3.1 编码树单元CTU |
2.3.2 编码单元CU |
2.3.3 预测单元PU |
2.3.4 变换单元TU |
2.4 SHVC标准的可伸缩类型 |
2.4.1 空间可伸缩编码 |
2.4.2 时间可伸缩编码 |
2.4.3 质量可伸缩编码 |
2.5 编码质量的评价标准 |
2.6 本章小结 |
第3章 SHVC标准帧内预测编码深度决策快速算法 |
3.1 SHVC标准帧内预测CU编码深度决策过程 |
3.2 提出的编码深度决策快速算法 |
3.2.1 编码树单元CTU的交流系数能量 |
3.2.2 自适应双阈值的选取与更新 |
3.2.3 编码深度的层间相关性 |
3.2.4 增强层CU的编码深度决策 |
3.2.5 算法具体流程 |
3.3 实验结果与分析 |
3.4 本章小结 |
第4章 SHVC标准帧内预测编码模式决策快速算法 |
4.1 SHVC标准帧内预测编码模式决策过程 |
4.2 提出的编码模式决策快速算法 |
4.2.1 编码模式的相关性分析 |
4.2.2 初始候选编码模式列表的构造 |
4.2.3 候选编码模式列表的优化 |
4.2.4 算法具体流程 |
4.3 实验结果与分析 |
4.4 帧内预测快速算法的整合 |
4.5 本章小结 |
第5章 SHVC标准帧间预测划分模式决策快速算法 |
5.1 SHVC标准帧间预测的PU划分模式 |
5.2 提出的PU划分模式决策快速算法 |
5.2.1 PU划分模式的层间相关性 |
5.2.2 PU划分模式快速决策 |
5.2.3 算法具体流程 |
5.3 实验结果与分析 |
5.4 本章小结 |
结论 |
参考文献 |
攻读硕士学位期间发表的论文及其他成果 |
致谢 |
(5)面向云移动媒体计算的图像视频通信和存储技术研究(论文提纲范文)
摘要 |
ABSTRACT |
符号对照表 |
缩略语对照表 |
第一章 绪论 |
1.1 研究背景与意义 |
1.2 云移动媒体计算概述 |
1.2.1 云计算 |
1.2.2 云移动媒体计算 |
1.2.3 云存储 |
1.3 研究动机 |
1.4 本文主要贡献 |
1.5 本文主要内容和结构安排 |
第二章 国内外研究现状 |
2.1 基于海量图像的图像重建 |
2.2 图像/视频编码 |
2.2.1 传统图像/视频编码 |
2.2.2 分布式图像/视频编码 |
2.2.3 分布式压缩感知编码 |
2.3 图像/视频传输 |
2.3.1 数字传输 |
2.3.2 模拟传输 |
2.3.3 混合模数传输 |
2.4 云端图像/视频存储 |
第三章 基于云端海量图像的分布式图像编码 |
3.1 引言 |
3.2 所提出方案的编码框架 |
3.3 边信息生成 |
3.3.1 小图压缩 |
3.3.2 基于海量图像的图像超分辨 |
3.4 基于变换域的分布式编码 |
3.5 模式决策 |
3.5.1 图像块分类 |
3.5.2 位平面模式决策 |
3.5.3 帧内编码 |
3.6 边信息和重建图像间的迭代精细化 |
3.7 实验结果及分析 |
3.7.1 数据库生成 |
3.7.2 模式决策和迭代精细化性能衡量 |
3.7.3 主观和客观质量比较 |
3.7.4 复杂度分析 |
3.8 本章小结 |
第四章 时变无线信道下基于云端海量图像的分布式压缩感知图像传输 |
4.1 引言 |
4.2 所提出的传输方案框架 |
4.3 小图传输和边信息生成 |
4.4 模式决策 |
4.5 基于分布式压缩感知的图像模拟传输 |
4.5.1 能量分配 |
4.5.2 压缩感知采样 |
4.6 联合帧内帧间图像重构 |
4.6.1 局部帧内解码 |
4.6.2 三维非局部帧内和帧间联合解码 |
4.7 基于最小均方误差的重构 |
4.8 实验结果及分析 |
4.8.1 数据库生成 |
4.8.2 实验设定 |
4.8.3 信噪比可伸缩性 |
4.8.4 带宽可伸缩性 |
4.8.5 主要技术性能分析 |
4.8.6 主观质量衡量 |
4.8.7 复杂度分析 |
4.9 本章小结 |
第五章 面向云存储的可伸缩视频非均匀保护 |
5.1 引言 |
5.2 可伸缩视频的非均匀保护在传输方面的相关工作介绍 |
5.3 局部可重构编码概述 |
5.4 理论分析 |
5.4.1 系统建模 |
5.4.2 系统方案 |
5.4.3 可靠性分析 |
5.4.4 方案示例 |
5.4.5 最佳编码方案选择 |
5.5 系统仿真及结果分析 |
5.5.1 系统设定 |
5.5.2 实验设定 |
5.5.3 存储代价比较 |
5.5.4 恢复代价比较 |
5.5.5 视频质量退化比较 |
5.6 本章小结 |
第六章 总结与展望 |
6.1 本文工作作总结 |
6.2 未来工作展望 |
6.2.1 本文存在的问题及可能改进 |
6.2.2 人工智能下面向云移动媒体计算的新问题 |
参考文献 |
致谢 |
作者简介 |
(6)面向高性能视频编码的码率控制与仿射预测研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 研究历史和现状 |
1.3 论文主要工作及内容安排 |
第二章 高性能视频编码及其扩展基础知识 |
2.1 HEVC基本框架 |
2.2 HEVC灵活的编码结构 |
2.2.1 HEVC灵活的参考结构 |
2.2.2 HEVC灵活的划分方式 |
2.3 HEVC的灵活帧间预测方式 |
2.3.1 Skip模式 |
2.3.2 先进运动矢量预测(AMVP)以及运动估计 |
2.3.3 融合模式(merge) |
2.3.4 运动估计 |
2.3.5 运动补偿 |
2.4 HEVC可伸缩扩展 |
2.5 HEVC率失真及λ域码率控制简介 |
2.5.1 HEVC率失真 |
2.5.2 λ域码率控制 |
第三章 高性能视频编码中的最优比特分配技术 |
3.1 现有比特分配技术 |
3.1.1 研究动机 |
3.1.2 现有技术 |
3.1.3 本章贡献 |
3.2 λ域R-D分析框架 |
3.3 图片级比特分配算法 |
3.4 BU级比特分配算法 |
3.5 实验结果 |
3.5.1 仿真环境 |
3.5.2 图片级比特分配算法实验结果 |
3.5.3 BU级比特分配算法实验结果 |
3.5.4 图片级和BU级比特分配算法相结合实验结果 |
3.5.5 实验结果总结 |
3.6 本章小结 |
第四章 可伸缩高性能视频编码中的码率控制技术 |
4.1 可伸缩视频编码的码率控制技术概述 |
4.1.1 研究动机 |
4.1.2 现有可伸缩视频编码码率控制技术 |
4.1.3 本章贡献 |
4.2 选择一个合适的R-D模型 |
4.2.1 HEVC中R-Q和R-λ模型简要介绍 |
4.2.2 HEVC可伸缩扩展中的R-λ模型的仔细验证 |
4.3 针对可伸缩高性能视频编码的λ域码率控制技术 |
4.3.1 时间可伸缩的码率控制技术 |
4.3.2 空间和质量可伸缩的码率控制技术 |
4.3.3 自适应R-λ模型参数估计 |
4.4 实验结果 |
4.4.1 时间可伸缩实验结果 |
4.4.2 空间和质量可伸缩实验结果 |
4.4.3 实验结果总结 |
4.5 本章小结 |
第五章 针对高性能视频编码的高性能仿射运动补偿框架 |
5.1 仿射预测技术概述 |
5.1.1 研究动机 |
5.1.2 现有的仿射运动补偿技术 |
5.1.3 本章贡献 |
5.2 本文提出的仿射运动补偿框架 |
5.2.1 四参数仿射运动模型 |
5.2.2 两个角点运动矢量决定方式 |
5.2.3 快速仿射运动补偿方式 |
5.3 实验结果 |
5.3.1 仿真实验 |
5.3.2 实验性能 |
5.3.3 实验分析 |
5.3.4 实验小结 |
5.4 本章小结 |
第六章 总结与展望 |
6.1 论文总结 |
6.2 未来展望 |
参考文献 |
致谢 |
在读期间发表的学术论文与取得的研究成果 |
(8)基于HEVC标准的可伸缩视频编码技术研究(论文提纲范文)
摘要 |
Abstract |
目录 |
第1章 绪论 |
1.1 课题背景和研究意义 |
1.2 国内外研究现状 |
1.3 本文的结构安排 |
第2章 HEVC 中的关键技术与 SVC 扩展技术 |
2.1 引言 |
2.2 HEVC 的基本框架 |
2.2.1 HEVC 中的编码单元 |
2.3 HEVC 的关键技术 |
2.3.1 HEVC 多角度帧内预测 |
2.3.2 HEVC 中的帧间预测技术 |
2.4 SVC 技术的基本原理 |
2.4.1 时间可伸缩 |
2.4.2 空间可伸缩 |
2.4.3 质量可伸缩编码 |
2.5 SHVC 的测试环境 |
2.6 本章小结 |
第3章 基于 HEVC 的质量可伸缩视频编码 |
3.1 引言 |
3.2 层间纹理预测模式 |
3.3 层间 MPM 预测 |
3.4 层间运动矢量预测 |
3.5 层间 Merge 模式 |
3.6 实验结果 |
3.7 本章小结 |
第4章 基于 HEVC 的空间可伸缩视频编码 |
4.1 引言 |
4.2 加权帧内预测 |
4.3 自适应联合加权预测 |
4.4 自适应层间滤波器 |
4.5 实验结果 |
4.6 本章小结 |
结论 |
参考文献 |
攻读硕士学位期间发表的学术论文 |
致谢 |
(9)基于内容分析的图像视频编码研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 引言 |
1.2 国内外研究现状 |
1.3 本文的结构安排和创新点 |
第2章 视觉内容分析技术简介 |
2.1 像素层面视觉模式分析 |
2.2 局部视觉特征分析 |
2.3 全局视觉相似度分析 |
第3章 基于视觉模式分析的图像编码 |
3.1 研究思路概述 |
3.2 本文采用的视觉模式分析技术简介 |
3.3 基于视觉模式分析的图像编码框架 |
3.4 基于视觉模式分析的编码模式 |
3.4.1 DCT域下采样技术 |
3.4.2 基于视觉模式的学习和映射 |
3.4.3 自适应优化模式选择 |
3.5 实验结果 |
3.6 本章小结 |
第4章 基于视觉模式分析的HEVC可伸缩视频编码 |
4.1 可伸缩视频编码概述 |
4.2 相关技术简介 |
4.2.1 H.264可伸缩视频编码标准 |
4.2.2 新一代高效视频编码(HEVC)标准简介 |
4.3 基于视觉模式分析的HEVC可伸缩视频编码框架 |
4.4 基于视觉模式学习和映射的层间预测模式(L-模式) |
4.4.1 L-模式中视觉模式相关性构建 |
4.4.2 运动向量辅助的视觉图像片搜索 |
4.4.3 视觉图像片映射 |
4.4.4 质量可伸缩编码下的L-模式简化 |
4.5 基于HEVC四叉树分析的层间预测模式(Q-模式) |
4.6 自适应优化模式选择 |
4.7 系统复杂度分析 |
4.8 实验结果 |
4.8.1 空间可伸缩编码效率分析 |
4.8.2 质量可伸缩编码效率分析 |
4.8.3 编码模式分布统计 |
4.8.4 层间预测信号比较 |
4.9 本章小结 |
第5章 基于局部特征分析的图像编码 |
5.1 SIFT局部特征及其编码技术简介 |
5.2 图像重建技术简介 |
5.3 基于局部特征分析的图像编码框架 |
5.4 图像信息分析、提取和压缩 |
5.4.1 基于子带和SIFT特征分析的信息提取 |
5.4.2 提取信息复合编码 |
5.5 SIFT匹配分析和基于子带的图像重建 |
5.5.1 复合解码器 |
5.5.2 基于SIFT的相关图像集检索 |
5.5.3 视觉相似图像片提取 |
5.5.4 基于子带和视觉模式分析的图像重建 |
5.6 实验结果与讨论 |
5.6.1 测试结果 |
5.6.2 实验结果讨论 |
5.7 本章小节 |
第6章 基于全局相似度分析的图像集编码 |
6.1 研究思路概述 |
6.2 图像集编码技术简介 |
6.3 图像校正技术简介 |
6.4 基于特征和全局相似度分析的图像集编码框架 |
6.5 基于特征距离的编码结构分析 |
6.5.1 基于特征距离的有向图 |
6.5.2 基于特征的最小生成树 |
6.5.3 预测编码结构确定 |
6.6 基于特征的图像间三步预测 |
6.6.1 基于特征的几何变换 |
6.6.2 基于特征的光度变换 |
6.6.3 基于块的运动补偿 |
6.7 实验结果分析 |
6.7.1 多模型预测的性能评估 |
6.7.2 光度变换性能评估 |
6.7.3 基于块的运动补偿性能评估 |
6.7.4 整体性能评估 |
6.7.5 深度限制的影响 |
6.7.6 复杂度分析 |
6.8 本章小结 |
第7章 总结与展望 |
7.1 本文工作总结 |
7.2 未来工作展望 |
参考文献 |
致谢 |
在读期间发表的学术论文与取得的其他研究成果 |
(10)小波变换在可伸缩性视频编码中的应用(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 课题的研究背景和研究意义 |
1.2 国内外研究现状 |
1.3 论文结构 |
1.4 本章小结 |
第二章 可伸缩性视频编码概述 |
2.1 SVC标准中可伸缩性编码工具 |
2.1.1 时域可伸缩性编码工具 |
2.1.2 空间可伸缩性编码工具 |
2.1.3 质量可伸缩性编码工具 |
2.1.4 联合可伸缩性 |
2.2 基于小波的可伸缩性编码工具 |
2.2.1 运动补偿时域滤波 |
2.2.2 离散小波变换 |
2.2.3 嵌入式零树小波 |
2.3 可伸缩性编码结构 |
2.3.1 t+2D结构 |
2.3.2 2D+t结构 |
2.3.3 2D+t+2D结构 |
2.4 本章小结 |
第三章 杠铃提升的实现方案 |
3.1 提升机制 |
3.2 杠铃提升机制 |
3.3 杠铃提升的实现 |
3.4 杠铃提升仿真结果 |
3.4.1 CW为0.5与四临近像素方案 |
3.4.2 CW为0.75与四临近像素方案 |
3.5 本章小结 |
第四章 基于杠铃提升的可伸缩性视频编码 |
4.1 二维小波视频编码概述 |
4.2 三维小波视频编码概述 |
4.2.1 不包括运动估计和补偿的三维小波视频编码 |
4.2.2 包括运动估计和补偿的三维小波视频编码 |
4.3 杠铃提升在MCTF中的应用 |
4.4 杠铃提升在WSVC中的仿真 |
4.4.1 宏块级权重分配与帧级临近像素方案 |
4.4.2 仿真结果 |
4.5 下降百分比分析 |
4.5.1 CW与下降百分比的关系 |
4.5.2 单峰特性的应用 |
4.6 本章小结 |
第五章 总结与展望 |
5.1 总结 |
5.2 对未来的展望 |
参考文献 |
致谢 |
作者攻读学位期间发表的学术论文目录 |
四、精细空间可伸缩视频编码方案实现(论文参考文献)
- [1]基于可伸缩编码的全景视频关键技术研究[D]. 于越. 北京邮电大学, 2020(05)
- [2]SCMA网络中的可伸缩视频多播技术研究[D]. 孙朝辉. 西安电子科技大学, 2020(05)
- [3]基于结构化稀疏表示的压缩视频采样[D]. 李勇. 上海交通大学, 2019(06)
- [4]可伸缩视频编码标准SHVC的低复杂度编码技术研究[D]. 余唱. 哈尔滨工业大学, 2018(01)
- [5]面向云移动媒体计算的图像视频通信和存储技术研究[D]. 宋晓丹. 西安电子科技大学, 2017(01)
- [6]面向高性能视频编码的码率控制与仿射预测研究[D]. 李礼. 中国科学技术大学, 2016(02)
- [7]视频编码技术的若干新进展[J]. 黎洪松,程福林,艾新宇. 计算机应用研究, 2016(08)
- [8]基于HEVC标准的可伸缩视频编码技术研究[D]. 吴刚. 北京工业大学, 2014(03)
- [9]基于内容分析的图像视频编码研究[D]. 石中博. 中国科学技术大学, 2014(10)
- [10]小波变换在可伸缩性视频编码中的应用[D]. 张卓良. 北京邮电大学, 2014(04)