MPEG视频的发展趋势

MPEG视频的发展趋势

一、MPEG视频的发展趋势(论文文献综述)

肖焯[1](2021)在《音视频文件的DNA数据存储编解码方法及其应用》文中进行了进一步梳理随着数据信息总量的飞速增长,传统的存储介质逐渐不能满足海量数据存储要求。与传统的存储介质相比,DNA数据存储具有存储密度高和保存寿命长等优势,逐渐成为存储领域研究的热点。DNA数据存储是由DNA合成与测序技术与计算机存储相融合的新领域,通过碱基对的有序组合来存储数字信息。DNA数据存储编解码方法是实现大规模DNA数据存储的重要研究方向。本论文的研究重点是音视频文件的DNA数据存储编解码方法和冗余纠错编解码规则与应用,针对时间序列音视频文件,提出DNA数据存储的编解码方法,本论文主要内容包括以下几方面:1.提出音视频文件DNA数据存储的编解码方法:针对音视频文件数据,提出DNA数据存储的编解机制和索引序列编码方法,解决音视频文件存储数据量大和DNA数据存储编解码密度低的问题,提高音视频文件DNA数据存储的数据存储密度和存储效率。2.提出时间序列音视频文件的DNA数据存储纠错编解码方法:针对时间序列音视频文件,研究DNA数据存储冗余纠错方法,构建基于Reed-Solomon冗余纠错码的DNA数据存储单元,解决时间序列音视频文件在DNA数据存储中冗余纠错编码和数据存储单元索引地址编码问题,实现时间序列数据DNA数据存储的随机读取和降低DNA数据存储出现的解码错误。3.构建面向COVID-19音视频文件的DNA数据存储系统原型:针对时间序列音视频文件的DNA数据存储需求,设计时间序列音视频文件的DNA数据存储框架和功能模块,实现面向COVID-19长时间序列的音视频文件的DNA数据存储系统原型,将系统运行的结果进行可视化且达到较好的线上系统使用效果。针对如何准确高效地将音视频文件进行DNA数据存储是DNA数据存储领域的重要研究目标,本论文针对音视频文件进行DNA数据存储的不足,提出DNA数据存储的编解码方法和DNA数据存储纠错方法,实现高准确性和高可靠性的DNA数据存储。

罗一帆[2](2021)在《基于媒体特征分析的自适应音视频水印关键技术研究》文中提出随着多媒体技术、网络技术的发展,多媒体数字产品的复制与传播变得非常便捷。相应的,盗版行为也日益猖獗,给版权商带来了不可估量的经济损失。因此,急需有效的版权保护措施来遏制盗版行为。在这一背景下,学者们提出了数字水印技术,经过近年来的快速发展,已成功应用于多媒体数字产品的版权保护,挽回了盗版带来的经济损失。因而,研究数字水印技术,进一步提升其版权保护效果,是一项具有重要理论意义与应用价值的工作。音视频作为视听媒体的代表,其版权保护是数字水印研究的重点,研究者们已提出了多种音视频数字水印方法。但现有方法对音视频信号在时-频域中的变化特征缺乏充分的研究与应用,导致水印抗时域同步攻击、几何变换等攻击能力不足,水印鲁棒性和不可感知性均有待提升;同时,对新发展起来的无损压缩音频、3D视频研究不足,少有针对性数字水印算法。为解决这些问题,本文基于音视频特征信息分析,从以下两个方面提出解决思路。第一,分析音视频信号时-频域变化规律,根据规律构建特征信息作为信号自适应分段标志、确定水印嵌入位置;水印嵌入位置随特征信息变化而改变,而各类攻击对特征信息影响小,水印抗同步攻击、几何攻击等攻击鲁棒性得到提升。第二,将水印嵌入与提取过程同音频信号变化特征、编解码特征、视频角点特征、3D视图渲染特征相结合,充分运用特征信息来提升水印不可感知性和抗各类攻击的鲁棒性。根据解决思路,本文提出了以下解决方案:依次构建在各类攻击下鲁棒性更强的音频节拍、音频显着状态、视频角点、视频对象动作等特征信息作为信号分段、水印嵌入位置选择或水印认证标志,实现水印抗同步攻击鲁棒性的提升。针对有损压缩、无损压缩音频,2D、3D视频,将特征信息构建与水印嵌入、提取方法相结合,分别设计双通道音频水印算法、双域音频水印算法、与无损压缩编码相结合的无损音频水印算法、与视觉密码相结合的2D视频‘零水印’算法、与3D渲染模式相结合的3D视频水印算法,各有侧重地提升水印鲁棒性和不可感知性。根据解决方案,具体算法实现如下:一、提出了基于信号自适应分段与嵌入强度优化的双通道音频水印算法。利用自相关检测法对音频信号进行自适应分段,作为水印嵌入位置选择标志,提高水印抗同步攻击鲁棒性。构建音频信号双通道特征信息,设计水印双通道嵌入与提取方法,降低水印嵌入强度,提高水印不可感知性。二、提出了基于离散小波包变换的双域音频水印算法。设计更具鲁棒性的音频信号自适应分段方法,水印具备更强的抗同步攻击能力;引入心理声学模型,将音频信号划分为听觉掩蔽域和被掩蔽域,设计符合掩蔽效应的双域水印嵌入位置选择方法、水印嵌入强度自适应控制方法,在双域中同时进行水印嵌入与提取,既提高水印的鲁棒性,又能保障其不可感知性。三、提出了针对MPEG-4 SLS格式的无损压缩音频水印算法。构建MPEG-4 SLS(Scalable Lossless Coding)编码整型修正离散余弦变换(Integer Modified Discrete Cosine Transform,Int MDCT)系数显着状态特征信息作为水印嵌入位置选择标志,增强特征信息鲁棒性,实现水印抗同步攻击鲁棒性的提升;设计与无损编解码技术相结合的水印嵌入与提取方法,提高水印抗各类信号处理攻击的鲁棒性,同时应用听觉掩蔽效应实现对水印嵌入强度的有效控制。四、提出了基于时-空域特征和视觉密码的视频‘零水印’算法。设计有限状态机进行关键帧选择,在关键帧中构建时-空域角点特征信息作为水印认证信息元素,提高特征信息抗同步攻击、色彩与几何攻击鲁棒性。将特征信息与视觉密码相结合,生成鲁棒性水印认证信息,在版权机构进行注册,在不改变视频信号的前提下实现水印嵌入。五、提出了基于深度图像渲染(Depth-image-based rendering,DIBR)的3D视频水印算法。与DIBR特征进行融合,构建视频帧对象动作特征信息作为水印嵌入位置自适应选择标志,增强特征信息鲁棒性,提升水印抗深度信息变化、几何变换攻击鲁棒性;设计同DIBR渲染过程相结合的水印嵌入与提取方法,提升水印鲁棒性和不可感知性。综上所述,本文针对现有音视频水印方法存在的问题,基于特征信息分析对音视频数字水印关键技术进行研究。分析音视频信号时-频域变化特征与鲁棒性特征信息提取方法,提出了问题解决思路,给出了解决方案。实现了在小波域、时空域、压缩域中对有损压缩音频、无损压缩音频、2D视频、3D视频进行水印嵌入与提取,有效增强了水印鲁棒性和不可感知性,为水印算法的应用打下了更坚实的基础。

杜玉敏[3](2020)在《铁路综合视频监控系统升级优化的研究》文中研究说明近几年,我国高速铁路的发展势头非常强劲,铁路领域视频监控系统技术运用日益广泛和成熟,随着我国高铁的大量建设和里程的增多,我国的高速铁路总公里数已接近4万公里,居世界第一。高铁覆盖的范围越来越大,列车的速度也越来越快,所带来的积极影响是极大的改善了大众的出行,列车的高速度带来的不利一面就是铁路事故发生的概率也随之增大。因此铁路领域的视频监控技术也越来越受到重视。目前,综合视频监控系统的建设、推广、使用逐步向智能化、数字和网络化的时代演变。基于对铁路运输安全和管理监控的需求,我们对铁路视频监控的要求越来越高,既有的铁路视频监控既不能与其他的系统联动,其功能和性能也不能满足各个业务部门的需求。视频监控对铁路的重要性已日益凸显,因此急需对既有的铁路视频监控系统进行改造和升级。论文针对呼和局视频监控系统互联互通性差、维护比较困难的问题,研究分析了既有系统的问题和不足,从系统构架、编码方式、组网、联动等方面做出了改进。论文主要工作如下:(1)分析了呼和浩特铁路局既有视频监控的情况,并对呼和浩特铁路局既有视频监控的组网、功能、性能做了充分的调研,分析了既有系统的问题和不足,提取了相关的测试数据,并根据铁路总公司对视频监控系统做出的规范和要求,确定了呼和浩特铁路局视频监控系统的组网因由原来的两级变为四级。(2)经过分析研究确定了应将呼和浩特铁路局调度所设置为视频区域节点,也确定了需要升级为Ⅰ级节点和Ⅱ级节点的站点,并根据升级需求选定所需设备,对新系统的设备数据进行升级,明确了每个节点升级的具体作业内容,最后根据升级计划逐步完成了改造升级工程。(3)对新系统进行了测试,测试结果表明升级系统的功能和性能都有了较大提升,满足了各业务部门的需求,实现了呼和浩特局视频监控系统的升级。本文的研究成果已运用于呼和浩特局铁路线,对提高呼和浩特局视频监控服务质量、保证行车安全、降低企业运营成本起到了重要作用。

刘杰[4](2020)在《基于客户端缓冲区状态的DASH码率选择算法研究》文中进行了进一步梳理流媒体业务往往传输数据量庞大,为了利用有限并不断波动的带宽传输高质量的音视频数据,MPEG组织和3GPP共同制定了MPEG-DASH标准。而MPEG-DASH流媒体传输系统中核心部分为客户端自适应算法,算法的优劣会影响用户的体验质量。如何设计一个MPEG-DASH客户端自适应算法来提高用户体验质量,受到众多国内外学者的关注。针对DASH流媒体系统中单个客户端在无线网络下播放视频的场景,为了利用有限带宽传输高质量音视频数据以提高用户体验质量,提出了基于缓冲区状态的客户端自适应算法。首先对MPEG-DASH系统框架与技术规范进行了深入研究,接着对现有的经典MPEG-DASH码率自适应算法进行了详细分析,指出传统自适应算法存在的不足。然后对MPEG-DASH的体验质量评价指标进行分析,具体介绍了4个重要指标:视频重复缓冲时间与次数、视频平均码率、码率切换次数以及启动时延。通过分析得出这些指标之间存在着制约关系,并提出客户端自适应算法设计目标。接着分析了缓冲区的动态特性。在此基础上,提出基于缓冲区状态的控制器来实现DASH客户端的码率自适应,通过缓冲区占用率以及缓冲区变化率进行码率决策,并引入码率控制因子减少不必要的码率切换,在多个DASH体验质量评价指标间取得平衡。通过仿真实验对本文所提算法进行性能分析,实验结果表明,本文算法在降低重复缓冲事件的发生的同时,选择的视频分段的码率较高,从而提高用户体验质量。对提升MPEG-DASH流媒体业务的用户体验质量具有一定的实用价值。

王彬[5](2020)在《高自由度视频编码及渲染关键技术研究》文中提出人类在观看真实场景时,可自由地进行位置和朝向的变动。高自由度视频模拟了这一特性,采集用户在观看视频时位置和朝向的信息,实时渲染目标视点图像呈现给用户,提供双目立体视差和运动视差,使用户获得强烈的交互式和沉浸式视觉体验。国际标准组织MPEG已开展相关标准制定工作,推动高自由度视频尽早进入市场。但是,高自由度视频在实际应用中还存在诸多障碍。首先,高自由度视频需布置大量视点采集场景信息,导致传输数据量大幅增加,对传输带宽提出考验。其次,市场主流接收设备受限于处理能力,对编解码技术标准和解码、渲染的数据量都有强约束。因此,本文针对高自由度视频中的关键技术环节进行研究,取得了如下创新性研究成果:1.针对高自由度视频传输数据量过高的问题,本文设计了高效的多视点融合表达方法,去除了视点间信息的重复表达。本方法自适应地从多视点中选取出有效信息率高的若干视点并以此剔除剩余视点中已被采集的重复像素,将剩余有效像素截取为若干个子图像,送入到后续处理环节。实验结果表明,相比于传输全部源视点,本方法平均减少70.6%的传输像素数,有效信息率大幅提升。同时,在相同传输码率下,目标视图的合成质量获得1.4d B的性能增益。2.针对截取出的补充子块图像的有效组织问题,本文提出了补充视点子块的合并、放置等改进方法,更好地适配块划分、帧间/帧内预测等编码技术特点,提升了编解码的效率。实验结果表明,本方法在通测条件下分别在Y、U、V分量平均获得13.37%、3.65%和4.16%的性能增益。3.针对高自由度视频中目标视图合成渲染的实时性问题,本文提出了基于图像子区域的快速筛选方法,以子区域为单位快速判决是否有像素落入到目标视图中,筛除对目标视图无影响的子区域,降低合成渲染的计算负担。实验结果表明,针对场景视角域较大的序列,在不改变目标视图合成质量下,本方法平均筛除72.15%的传输像素,减少49.38%的总处理时间,大大提升了高自由度视频的实用性。最后,本文对各个研究点的具体内容作出了总结,并对未来高自由度视频的发展进行了展望。

蒋妮[6](2020)在《视频编码标准帧间预测、码率控制及率失真优化技术研究》文中进行了进一步梳理在新兴技术飞速发展的时代,科学技术也在与时俱进,视频应用也趋向于多样化、超清化发展,促使了下一代视频编码标准H.266的诞生、发展与优化。与上一代视频编码标准H.265的压缩性能进行对比,H.266编码标准在相同的视频序列与相同测试条件下,编码增益提高了30%。视频编码标准都采用了混合视频编码框架,H.266编码标准也沿用了这个框架,并且对块的划分、帧内预测、帧间预测等模块相关技术进行了改进。本文重点针对视频编码中帧间预测、码率控制、率失真优化三个模块中的相关技术进行了研究和分析,对其中的关键技术进行了优化改进,并取得一定的编码增益。本文主要的研究工作可以分为以下三点:1、在帧间预测过程中,运动矢量的传输是非常重要的。更精细的运动矢量精度能够提供更准确的预测,由此得到的估计失真会更小,并能有效的去除时域冗余。在最新的编码标准H.266/VVC中,运动矢量精度有3种,并且用可变长的2比特的标志位来传输运动矢量信息。本文针对帧与帧之间的相关信息,对前一帧中的相关运动矢量精度信息进行统计,待编码帧中的运动矢量精度信息参考前一帧的信息,并且将使用最多的运动矢量精度信息分配最少的比特进行传输,反之,使用最少的运动矢量精度信息分配最多的比特,以此来实现传输运动矢量精度信息的标志位所占用比特进行自适应的分配,节省编码比特,提高编码效率。2、本文主要针对新编码标准H.266的随机接入配置层次编码结构中的时域依赖率失真优化问题,分析了GOP=16的层级时域依赖关系,建立了时域传播链,并对失真进行估计,进而求得拉格朗日乘子,最后解决率失真优化问题。在本文中对失真进行估计时,引入了权重失真因子,对失真进行微调和改进,让失真的估计更加准确。其次,对层级的QP进行了修正和调整,通过聚合传播因子调整拉格朗日乘子。该方法对通测序列都有一定的编码增益,其中,背景类似的序列编码压缩性能效果显着。3、码率控制包括目标比特分配和量化参数的确定两个主要步骤。在进行目标比特分配时,分为GOP级、帧级、CTU级,本文针对GOP=16提出了一种新的基于λ域帧级目标比特分配,帧级目标比特分配分为均匀比特分配、固定比特分配和自适应比特分配。在固定比特分配中,统计所有通测序列的各层图像所用比特,利用最小二乘法为各层图像分配比特权重。对于自适应比特分配,统计通测序列QP从19至35的第一个GOP各层λ值,通过处理数据得到各层λ的权重比值表,最后确定量化参数。该算法在H.265/HEVC编码标准参考软件HM16.15上发挥了良好的码率控制效果,取得很大的编码增益。

李逍[7](2020)在《全景视频传输与关键算法优化研究》文中认为随着信息产业的不断发展和创新,互联网产业对人们生活的影响也越来越大,甚至可以说是影响到了整个社会的方方面面,不仅方便了我们的生活,也提高了人们的生活质量。而近几年发展起来的全景视频和虚拟现实技术也已经开始逐渐走进人们的生活之中,让人们能够身临其境的享受观看视频的快感。但同时,由于网络传输环境的限制以及全景视频巨大的数据量,给全景视频的发展带来了挑战。目前的网络环境无法支持全景视频这么大的数据量的全部内容的高质量传输,所以有许多自适应码率传输方案来实现其传输,首先对全景视频在空间和时间上分块,而观看者在某一时刻只能看到整幅画面的一部分,视角区域内的全景视频块传输高质量内容而其他区域传输低质量的视频,在保证了观众观看体验的同时也能够有效降低传输所需带宽,提高了网络带宽的利用效率;但是如果传输到客户端时用户的视角已经发生了改变,用户观看的内容已经是低码率内容,传输的高码率内容没有及时跟上用户的视角转换,那么就无法保证用户的观看质量;所以在本文中提出了一种基于多重CNN网络的视角预测算法,根据用户的观看轨迹和全景视频的内容融合的方案得到下一时刻的可能观看位置。通过实验证明,利用该方案较传统方案能够有效提高视角预测的准确率,并最终提升用户的观看体验。而在整个全景视频系统中,我们考虑优化整体系统的Qo E,首先要考虑到在服务器端编码时的视频内容失真问题,而后是在客户端播放时的用户体验,包括视角区域内的观看质量等;基于这种想法,本文提出了一种基于视角预测的码率自适应算法,根据上一部分的预测算法,一段时间的观看内容和观看轨迹可以预测接下来某一时刻的观看位置,通过该位置指导在服务器端的处理选择,主要是相关量化参数等,同时,我们要保证的是视频的总码率不得高于当前网络带宽,客户端用户观看的内容要尽量质量较高;我们根据这样的原理,设定了衡量整个传输系统的Qo E,并在实验中证明了我们的基于视角预测的自适应码率算法是有效的,可以在多种网络情况下保证用户的观看体验。

周蓉蓉[8](2019)在《基于Android平台的MPEG-DASH流媒体QoE研究》文中研究指明随着互联网应用和普及,网络娱乐内容的极大丰富,人们越来越倾向于在网络上实时观看视频。然而传统的流媒体技术有着各种各样的弊端,比如RTSP/RTP流媒体技术需要特定的流媒体服务器,安装维护复杂,且不能穿透防火墙;比如HTTP渐进式下载无法选择码率,如果网络波动,要么可能会导致停顿,要么浪费带宽。MPEG-DASH(Dynamic Adaptive Streaming over HTTP)结合了HTTP渐进式下载技术和自适应传输技术的优点,可以很好的解决这些问题。本文主要研究了基于Android的MPEG-DASH的流媒体网络自适应算法,基于嵌入式媒体盒环境,围绕用户体验QoE(Quality of Experience)的提升,从初始化播放延时,缓冲下溢次数,平均播放码率,播放时总码率切换次数等几个方面进行了研究,提出了优化方案。文章首先介绍了MEPG-DASH在自适应算法方面的研究现状;然后比较详细的介绍了MEPG-DASH自适应流媒体的技术标准,包括MEPG-DASH的技术系统框架,MPD文件的组成和结构,随后介绍了DASH采用的fragmentMP4封装,以及最常采用的H264格式的编码原理。基于上面提到的初始化播放延时,缓冲下溢次数,平均播放码率,总码率切换次数等几个方面的优化和提升,主要做了如下方面的工作:1)在缩短初始化播放延时方面,优化FFMPEG DASH Encoder/GPAC MP4BOX DASH Encoder;将解码器初始化需要的SPS/PPS信息,也称为Codec Specific Data(CSD),作为一个子字段添加到媒体呈现文件MPD中;并在客户端实现提前解析,并行初始化解码器,达到提升初始化播放速度的效果。2)考虑到DASH通常采用的是以动态码率编码为主的H264视频编码,在某些码率波动率大的片源情况下,可能在判断带宽是否足够时出现误判。本文使用初始化切片的sidx box项存放的全视频切片信息,计算出所有切片的切片码率;在播放时,依据接下来即将下载的切片码率与当前网络带宽以及缓冲区数据走势相结合来选择下一切片的码率。由于切片平均码率与片源平均码率有时相差超过100%,因此同时参考切片码率更切合实际使用情况。3)本文在Android 9.0客户端ExoPlayer APK基础上实现并验证了优化算法:在Ubuntu 18.04上搭建局域网Apache HTTP服务器,加入网络带宽限制模拟不同网络场景;实验证明在初始化播放速度,播放缓冲下溢次数,切换频繁程度等方面都有了明显的提升;就综合QoE指标来看,在相比较的几种算法中,本文提出的NextN算法在两个实验片源的各种带宽限制场景中都具有最高的QoE值,这就验证了本论文方法的有效性。

付园鹏[9](2019)在《无线环境下基于DASH的流媒体传输算法研究与系统实现》文中指出音视频业务需求的快速增长促进了流媒体技术的不断发展。由于无线网络吞吐量的变化存在随机性,传统的流媒体技术已经很难满足无线视频用户的业务需求。基于MPEG-DASH的流媒体技术凭借其良好的兼容性和灵活性,自诞生以来就受到了业界的广泛关注。DASH客户端可以自适应地从HTTP服务器下载多种码率版本的媒体切片,为视频内容的高效传输和流畅播放提供可靠保障。本文首先介绍了流媒体传输技术的发展和MPEG-DASH标准的主要内容。其次,针对现有基于MPEG-DASH的码率自适应算法在无线网络中码率切换频率高和码率平均值低的问题,提出一种基于带宽和缓存联合控制的码率平滑切换算法。该算法主要由两部分组成:带宽检测机制和码率决策机制。带宽检测机制利用滑动窗口捕获最近一段时间内历史切片的下载信息检测带宽波动情况,并计算不同波动情况下的带宽预测值。码率决策机制综合考虑波动情况和缓存状态平滑可用带宽,接着采取相应的调整策略完成对切片码率的选择。本文还根据流媒体用户的QoE影响因素,确定了码率自适应算法的QoE评价指标及其统计函数。通过在单客户端独占链路场景和多客户端共享链路场景下分别对算法的性能进行仿真,本文得出实验结论,与基于模糊的码率自适应算法和基于吞吐量调节的码率自适应算法相比,所提算法不仅可以提高视频平均码率,而且可以有效减少在网络吞吐量剧烈波动和多客户端竞争带宽情形下的视频码率抖动。为了验证该算法的实际效果,本文采用服务器/客户端结构,设计并搭建了一个基于MPEG-DASH的流媒体传输系统,服务端使用Apache分发和存储视频片段及相关配置文件,DASH客户端则通过Android应用程序实现网络监测,码率选择,用户界面交互和视频播放等功能。最后,通过将所提算法集成到客户端,利用流量整形工具测试了本文所提算法的自适应效果。测试结果与仿真结果基本一致,表明码率平滑切换算法可以为无线流媒体用户提供更好的体验质量。

张文杰[10](2019)在《基于Tile的全景视频自适应传输技术研究》文中研究表明全景视频,也称为360°视频,是视频中较为特殊且新颖的一种类型。随着虚拟现实技术的快速发展,全景视频逐渐走入人们的视野。全景视频凭借沉浸式的特点给人们带来一种焕然一新的体验,现已成为未来视频服务的新型载体。全景视频具有高分辨率、高码率的特性,这给全景视频的传输带来了巨大的挑战。目前,基于Tile的全景视频自适应传输已经成为全景视频传输的一种主要趋势。它通过将全景视频划分为多个Tile,根据用户视域的变化每次仅传输视域内的Tile,有效地解决了上述问题。然而,这种传输方案在实际应用中带来一些实现上的困难,受硬件设备资源限制,客户端无法同时对多个Tile码流进行实时解码,这给全景视频的低时延传输带来了极大的挑战。因此,本文针对基于Tile的全景视频自适应传输技术展开研究,提出了一种基于码流融合的全景视频自适应传输解决方案。为了降低系统对客户端的硬件要求,本文设计并实现了基于Tile的全景视频自适应传输系统,结合改进的H.265/HEVC运动约束分块集技术提出了码流融合方案。该方案通过修改码流的部分语法元素将视域内的多个Tile流融合为一个码流,以便使用单个解码器对多个Tile实时解码,使用户在不同的客户端和不同网络条件下都能获得良好的观看体验。实验结果表明,本文提出的改进H.265/HEVC运动约束分块集技术对编码性能的影响在可接受范围之内,同时码流融合技术消耗的时间也是可忽略的。整体上讲,基于Tile的全景视频自适应传输系统运用改进的H.265/HEVC运动约束分块集技术和码流融合技术解决了客户端硬件资源受限带来的解码问题。在用户ROI预测不准确的情况下,由于视频压缩码流受限的编码结构,用户进行视角切换时总是存在FOV区域高清Tile切换不及时的问题,这在一定程度上影响了全景视频传输系统的体验。为了解决上述问题,本文结合MPEG-DASH协议的特征针对不同场景分别提出了基于码流组合的快速视角切换方案和基于参考帧替换的快速视角切换方案。实验结果表明,在保证产生非常小的额外带宽消耗和可以忽略的质量下降的同时,两种快速视角切换方案都能够有效地缩短用户视角切换时延,实现即时视角切换,提高了用户体验。

二、MPEG视频的发展趋势(论文开题报告)

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、MPEG视频的发展趋势(论文提纲范文)

(1)音视频文件的DNA数据存储编解码方法及其应用(论文提纲范文)

摘要
abstract
第1章 引言
    1.1 研究背景与研究意义
    1.2 研究现状与存在问题
    1.3 本论文的研究内容
    1.4 本论文的组织结构
第2章 DNA数据存储编解码相关技术
    2.1 音视频文件
    2.2 传统的编解码技术
        2.2.1 字符编解码技术
        2.2.2 音频编解码技术
        2.2.3 视频编解码技术
    2.3 DNA数据存储编解码技术
        2.3.1 DNA存储编码方法
        2.3.2 DNA数据写入
        2.3.3 DNA数据读取
        2.3.4 DNA存储和读取过程发生的错误
        2.3.5 DNA数据存储纠错编码
    2.4 本论文研究架构
    2.5 本章小结
第3章 DNA数据存储的编解码方法
    3.1 问题描述
    3.2 音视频文件DNA存储数据预处理
    3.3 音视频文件DNA数据存储和索引序列的编解码方法
        3.3.1 DNA数据存储编码方法
        3.3.2 DNA数据存储索引序列
    3.4 方法验证与结果分析
        3.4.1 实验数据与评价指标
        3.4.2 实验结果与分析
        3.4.3 时间复杂度分析
    3.5 本章小结
第4章 基于Reed-Solomon冗余纠错码的DNA数据存储单元
    4.1 问题描述
    4.2 时间序列音视频文件的DNA数据存储纠错方法
        4.2.1 Reed-Solomon冗余纠错码的数学原理
        4.2.2 冗余纠错编码规则
    4.3 DNA数据存储单元
        4.3.1 单个音视频文件DNA数据存储
        4.3.2 时间序列音视频文件DNA数据存储
        4.3.3 DNA数据存储单元格式
    4.4 方法验证及结果分析
        4.4.1 数据集和评估指标
        4.4.2 存储方案实验结果
    4.5 本章小结
第5章 面向COVID-19 音视频文件的DNA数据存储系统原型
    5.1 音视频文件的DNA数据存储系统设计
        5.1.1 系统业务需求
        5.1.2 系统功能设计
        5.1.3 基于RPA的系统总体架构设计
    5.2 DNA数据存储系统实现
        5.2.1 时间序列音视频文件数据集
        5.2.2 系统实现环境
        5.2.3 系统实现关键技术
        5.2.4 系统实现流程
    5.3 DNA数据存储系统展示
        5.3.1 界面说明与展示
        5.3.2 系统功能与性能测试
    5.4 本章小结
第6章 结束语
    6.1 本论文总结
    6.2 下一步研究方向
参考文献
作者简历及攻读学位期间发表的学术论文与研究成果
致谢

(2)基于媒体特征分析的自适应音视频水印关键技术研究(论文提纲范文)

摘要
Abstract
常用缩略词表
常用符号表
第1章 绪论
    1.1 研究背景及意义
    1.2 数字水印技术概述
        1.2.1 数字水印系统模型
        1.2.2 数字水印的分类
        1.2.3 数字水印的应用
        1.2.4 数字水印的性能特征
        1.2.5 音视频水印攻击类型
        1.2.6 数字水印性能评价指标
    1.3 国内外研究现状
        1.3.1 音频水印算法研究现状
        1.3.2 视频水印算法研究现状
        1.3.3 存在的问题
    1.4 本文主要研究内容
    1.5 本文结构安排
第2章 基于音频信号自适应分段与嵌入强度优化的双通道音频水印算法
    2.1 引言
    2.2 音频信号自适应分段
    2.3 音频信号双通道特征信息构建
    2.4 水印嵌入方法
    2.5 水印提取方法
    2.6 水印嵌入强度优化
    2.7 实验结果
        2.7.1 水印不可感知性评价
        2.7.2 水印鲁棒性评价
    2.8 本章小结
第3章 基于离散小波包变换的双域音频水印算法
    3.1 引言
    3.2 音频节拍检测与自适应分段
    3.3 音频信号双域划分与水印嵌入位置选择
    3.4 水印嵌入与提取
        3.4.1 水印嵌入规则
        3.4.2 自适应嵌入强度计算
        3.4.3 水印嵌入方法
        3.4.4 水印提取方法
    3.5 实验结果
        3.5.1 水印不可感知性评价
        3.5.2 水印鲁棒性评价
    3.6 本章小结
第4章 针对MPEG-4 SLS格式的无损压缩音频水印算法
    4.1 引言
    4.2 相关技术介绍
    4.3 水印嵌入与提取
        4.3.1 嵌入失真允许阈值
        4.3.2 显着状态与嵌入位置选择
        4.3.3 水印嵌入方法
        4.3.4 水印提取方法
    4.4 实验结果
        4.4.1 水印不可感知性评价
        4.4.2 水印鲁棒性评价
    4.5 本章小结
第5章 基于时-空域特征与视觉密码的视频零水印算法
    5.1 引言
    5.2 有限状态机设计与关键帧选择
        5.2.1 视频镜头分割
        5.2.2 有限状态机运行规则
    5.3 视频时-空域特征信息提取
        5.3.1 Harris-Laplace角点检测
        5.3.2 时域特征数据集构建
        5.3.3 频域特征数据集构建
    5.4 Ownership share的产生与水印提取
        5.4.1 Ownership share的产生
        5.4.2 水印提取方法
    5.5 实验结果
    5.6 本章小结
第6章 基于深度图像渲染的3D视频水印算法
    6.1 引言
    6.2 相关技术简介
        6.2.1 DIBR系统
        6.2.2 SIFT特征点检测
    6.3 水印嵌入位置选择
        6.3.1 视频场景分割
        6.3.2 SIFT特征点跨帧匹配
        6.3.3 匹配向量概率分布
        6.3.4 匹配向量主方向和水印嵌入位置选择
    6.4 水印嵌入与提取方法
        6.4.1 改进的扩频水印嵌入方法
        6.4.2 在中心视图中嵌入水印
        6.4.3 从左右视图中提取水印信息
    6.5 实验结果
        6.5.1 水印不可感知性评价
        6.5.2 水印鲁棒性评价
    6.6 本章小结
第7章 总结与展望
    7.1 本文工作总结
    7.2 研究展望
参考文献
作者在读期间科研成果简介
致谢

(3)铁路综合视频监控系统升级优化的研究(论文提纲范文)

摘要
Abstract
1 绪论
    1.1 课题的研究背景
    1.2 视频监控系统发展现状
    1.3 视频监控存在的问题及发展方向
    1.4 论文的结构
2 视频监控编解码技术
    2.1 ITU-T视频编码标准
    2.2 MPEG视频编码标准
3 呼和局视频监控系统合并升级技术方案
    3.1 呼和局视频监控系统现状
    3.2 呼和局综合视频监控系统设计
        3.2.1 视频终端和带宽设置
        3.2.2 视频存储设计
        3.2.3 系统功能及性能
4 呼和局视频监控系统升级的工程实现
    4.1 张呼线视频监控系统
        4.1.1 网络结构
        4.1.2 视频节点
        4.1.3 服务器及终端
    4.2 集包线视频监控系统升级
        4.2.1 包头站改造升级
        4.2.2 新增包头东站服务器
        4.2.3 萨拉齐站改造升级
        4.2.4 察素齐站改造升级
        4.2.5 呼和浩特西站改造升级
        4.2.6 视频监控系统合并
    4.3 服务器数据配置
        4.3.1 管理模块数据配置
        4.3.2 告警模块数据配置
        4.3.3 设备接入模块数据配置
5 呼和局升级视频监控系统测试
    5.1 测试内容
    5.2 功能测试
    5.3 性能测试
    5.4 系统图像质量评估
结论
参考文献
致谢

(4)基于客户端缓冲区状态的DASH码率选择算法研究(论文提纲范文)

摘要
Abstract
1 绪论
    1.1 课题研究背景及意义
    1.2 国内外相关研究进展
    1.3 研究内容与章节安排
    1.4 本章小结
2 DASH码率自适应技术分析
    2.1 DASH技术简介
    2.2 流媒体编码技术及工具
    2.3 MPEG-DASH系统框架与技术规范
    2.4 经典MPEG-DASH码率自适应算法分析
    2.5 本章小结
3 客户端码率自适应算法设计与分析
    3.1 MPEG-DASH的体验质量评价指标与算法设计目标
    3.2 DASH流媒体模型
    3.3 客户端缓冲区的动态特性分析
    3.4 基于缓冲区状态的码率自适应算法设计与分析
    3.5 本章小结
4 实验结果与分析
    4.1 仿真实验设置
    4.2 算法性能评价指标
    4.3 算法性能分析
    4.4 DASH流媒体系统搭建与测试
    4.5 本章小结
5 总结与展望
    5.1 本文主要研究工作
    5.2 研究展望
致谢
参考文献

(5)高自由度视频编码及渲染关键技术研究(论文提纲范文)

致谢
摘要
Abstract
缩写表
1 绪论
    1.1 沉浸式视频发展和高自由度视频系统
        1.1.1 沉浸式视频发展历程
        1.1.2 高自由度视频系统
    1.2 高自由度视频系统压缩技术
        1.2.1 单视点混合编码框架
        1.2.2 多视点三维视频编码技术
    1.3 高自由度视频的视图合成渲染技术
    1.4 本文的主要内容及安排
2 高效的多视点融合表达算法
    2.1 多视点间像素率降低的可行性分析
        2.1.1 多视点视频有效信息计算
        2.1.2 多视点视频有效信息分析
    2.2 多视点融合表达中有效像素提取算法
        2.2.1 基础视点选择
        2.2.2 补充子块图像截取
    2.3 实验结果与分析
        2.3.1 测试条件设置
        2.3.2 性能测试结果与分析
    2.4 本章小结
3 基于编码技术特性的补充子块图像组织方法
    3.1 TMIV中块级补充子块图像截取和组织方法
        3.1.1 连通域提取
        3.1.2 时域聚合
        3.1.3 子块拼接
    3.2 考虑编码技术特性的子块图像组织方法
        3.2.1 子块拼接限制
        3.2.2 子块图像合并
    3.3 实验结果与分析
        3.3.1 测试条件设置
        3.3.2 性能测试结果与分析
    3.4 本章小结
4 合成渲染中图像子区域的快速筛选方法
    4.1 视图合成渲染预分析
        4.1.1 视图合成渲染的主要环节
        4.1.2 结合多视点融合表达后的视图合成渲染分析
        4.1.3 现有的视图合成渲染不足
    4.2 合成渲染中图像子区域的快速筛选方法
        4.2.1 补充子块图像的快速筛选方法
        4.2.2 快速筛选方法的完善
    4.3 实验结果与分析
        4.3.1 测试条件设置
        4.3.2 性能测试结果与分析
    4.4 本章小结
5 总结与展望
参考文献
作者在攻读硕士学位期间的科研成果与科研工作

(6)视频编码标准帧间预测、码率控制及率失真优化技术研究(论文提纲范文)

摘要
abstract
第一章 绪论
    1.1 研究工作的背景及意义
    1.2 国内外研究现状
        1.2.1 H.26X系列
        1.2.2 MPEG系列
        1.2.3 AVS系列
        1.2.4 AV1 系列
    1.3 本文研究内容和创新点
    1.4 本文主要工作及章节安排
第二章 视频编码基础概述
    2.1 下一代视频编码的结构框架
    2.2 编码块的划分
        2.2.1 四叉树加二叉树划分
        2.2.2 三角划分
    2.3 帧内预测技术
        2.3.1 更加精细的帧内预测方向
        2.3.2 多参考线帧内预测
        2.3.3 帧内子分区
        2.3.4 矩阵加权帧内预测技术
    2.4 帧间预测技术
        2.4.1 仿射变换
        2.4.2 解码端运动矢量推导
        2.4.3 CU级双向加权预测
        2.4.4 帧内帧间组合预测
        2.4.5 双向光流
    2.5 变换和量化
    2.6 本章小结
第三章 H.266 编码标准中帧间预测技术的优化
    3.1 H.266 帧间预测技术的概述
        3.1.1 运动估计
        3.1.2 运动补偿
    3.2 自适应运动矢量精度
        3.2.1 背景
        3.2.2 帧间自适应运动矢量精度方法
    3.3 实验结果与分析
        3.3.1 实验设计
        3.3.2 实验结果
    3.4 本章小结
第四章 H.266 编码标准中率失真优化技术
    4.1 率失真优化技术的概述
    4.2 层次结构编码下的时域依赖关系
        4.2.1 低延迟配置下层次编码结构
        4.2.2 随机接入配置下层次编码结构
    4.3 随机接入配置下率失真优化
        4.3.1 问题分解
        4.3.2 信源失真传播分析
        4.3.3 拉格朗日乘子的估计
        4.3.4 实现细节
    4.4 实验结果及分析
    4.5 本章小结
第五章 H.265 码率控制
    5.1 码率控制问题概述
        5.1.1 码率控制发展历程
        5.1.2 经典的码率控制算法
        5.1.3 λ 域码率控制算法
    5.2 基于λ域的目标比特分配
        5.2.1 均匀比特分配
        5.2.2 固定比特分配
        5.2.3 自适应比特分配
    5.3 量化参数
    5.4 实验结果与分析
        5.4.1 实验设计
        5.4.2 实验结果
    5.5 本章小结
第六章 总结与展望
    6.1 全文工作内容总结
    6.2 未来展望
致谢
参考文献
攻读硕士学位期间取得的成果

(7)全景视频传输与关键算法优化研究(论文提纲范文)

摘要
ABSTRACT
第一章 绪论
    1.1 研究背景和意义
    1.2 课题研究现状
    1.3 研究内容与创新点
    1.4 章节安排
第二章 全景视频传输和相关算法技术概述
    2.1 引言
        2.1.1 图像显着性引言
        2.1.2 全景视频传输技术引言
    2.2 图像显着性
        2.2.1 显着性的基本概念
        2.2.2 图像显着性检测的相关算法
    2.3 全景视频传输系统概述以及相关算法
        2.3.1 全景视频的相关标准
        2.3.2 全景视频的传输框架
    2.4 本章小结
第三章 基于深度学习的视角预测算法
    3.1 引言
    3.2 基于深度学习的图像显着性检测算法
        3.2.1 图像显着性检测简介
        3.2.2 图像显着性检测的结构
        3.2.3 基于多重CNN的显着性检测结构的验证结果
    3.3 基于观看轨迹的视角预测方法
        3.3.1 LSTM网络模型
        3.3.2 其他基于轨迹进行预测的对比方案
        3.3.3 基于全景图像内容的预测优化
    3.4 数据预处理
    3.5 实验结果分析
    3.6 本章小结
第四章 基于视角预测的自适应码率传输算法
    4.1 引言
    4.2 基于视角预测的自适应码率传输算法的用户体验标准定义
        4.2.1 系统各个部分的性能评价
        4.2.2 衡量全景视频系统的评价指标
    4.3 传统方案以及其他全景视频传输算法实现
    4.4 基于视角预测的视频失真优化传输算法
    4.5 算法仿真及实验结果
        4.5.1 数据集处理
        4.5.2 传统算法实现
        4.5.3 基于视角预测的视频失真优化全景视频传输算法
    4.6 本章小结
第五章 总结与展望
    5.1 总结
    5.2 展望
参考文献
致谢
攻读硕士学位期间已发表或录用的论文

(8)基于Android平台的MPEG-DASH流媒体QoE研究(论文提纲范文)

摘要
ABSTRACT
第1章 绪论
    1.1 研究背景和意义
    1.2 相关研究进展
    1.3 主要研究工作与论文结构
    1.4 本章小结
第2章 流媒体相关技术综述
    2.1 媒体文件解析播放流程
    2.2 H264编码原理及图像序列
    2.3 视频动态码率介绍
    2.4 MPEG-DASH流媒体标准的框架结构
    2.5 MPD文件的介绍以及分层模型
    2.6 FRAGMENTED MP4介绍
    2.7 MPEG-DASH QOE评价指标
    2.8 本章小结
第3章 DASH初始化播放时延优化
    3.1 DASH初始化播放流程
    3.2 初始化播放耗时分析
    3.3 优化原理
    3.4 优化实现
        3.4.1 客户端优化
        3.4.2 服务器端DASH Encoder优化
    3.5 本章小结
第4章 DASH码率自适应算法优化
    4.1 经典自适应算法介绍
        4.1.1 基于带宽的自适应算法
        4.1.2 基于缓冲的自适应算法
        4.1.3 基于码率预测补偿的自适应算法
        4.1.4 基于缓冲水位等级的自适应算法
    4.2 改进算法NEXTN描述
        4.2.1 优化原理
        4.2.2 客户端实现
    4.3 QoE综合指标
    4.4 本章小结
第5章 系统搭建及测试
    5.1 实验环境与参数
        5.1.1 平台硬件
        5.1.2 网络搭建
        5.1.3 实验数据准备
    5.2 实验结果分析
        5.2.1 初始化播放时延优化验证
        5.2.2 码率自适应算法优化验证
        5.2.2.1 固定受限带宽网络场景
        5.2.2.2 梯形带宽网络场景
        5.2.2.3 模拟真实网络场景
    5.3 本章小结
第6章 总结与展望
    6.1 总结
    6.2 展望
参考文献
致谢

(9)无线环境下基于DASH的流媒体传输算法研究与系统实现(论文提纲范文)

摘要
Abstract
注释表
第1章 引言
    1.1 无线流媒体技术研究背景及意义
    1.2 流媒体传输技术国内外研究现状
        1.2.1 传统流媒体传输方式
        1.2.2 基于HTTP的自适应流传输方式
    1.3 本文主要内容
    1.4 本文组织结构
第2章 MPEG-DASH流媒体标准
    2.1 基于HTTP的自适应流传输技术
        2.1.1 主流HTTP自适应流传输方案简介
        2.1.2 MPEG-DASH主要优势
    2.2 MPEG-DASH主要内容
        2.2.1 MPEG-DASH基本框架
        2.2.2 MPD文件描述
        2.2.3 DASH切片描述
    2.3 MPEG-DASH码率自适应算法
        2.3.1 基于带宽的码率自适应算法
        2.3.2 基于缓存的码率自适应算法
        2.3.3 基于带宽和缓存联合控制的码率自适应算法
    2.4 本章小结
第3章 基于带宽和缓存联合控制的码率自适应算法研究
    3.1 码率自适应算法研究目标
        3.1.1 无线流媒体QoE影响因素
        3.1.2 无线流媒体QoE评价指标
    3.2 码率平滑切换算法设计
        3.2.1 带宽检测机制
        3.2.2 码率决策机制
        3.2.3 RSS算法流程
    3.3 仿真实验与分析
        3.3.1 仿真参数设置
        3.3.2 结果与分析
    3.4 本章小结
第4章 基于MPEG-DASH的无线流媒体传输系统实现
    4.1 系统设计与分析
    4.2 系统服务端搭建
        4.2.1 服务端配置
        4.2.2 媒体内容准备
    4.3 系统客户端实现
        4.3.1 网络监测模块
        4.3.2 文件下载模块
        4.3.3 MPD解析和视频播放模块
        4.3.4 自适应控制模块
        4.3.5 UI交互模块
    4.4 系统测试与分析
        4.4.1 运行与测试
        4.4.2 结论
    4.5 本章小结
第5章 总结与展望
    5.1 总结
    5.2 展望
参考文献
致谢
攻读硕士学位期间从事的科研工作及取得的成果

(10)基于Tile的全景视频自适应传输技术研究(论文提纲范文)

摘要
ABSTRACT
符号对照表
缩略语对照表
第一章 绪论
    1.1 研究背景与意义
    1.2 研究现状
    1.3 研究内容
    1.4 论文结构安排
第二章 全景视频传输系统与传输技术
    2.1 引言
    2.2 虚拟现实与全景视频
        2.2.1 虚拟现实
        2.2.2 全景视频
    2.3 全景视频传输系统
        2.3.1 全景视频应用框架
        2.3.2 全景视频映射方式
    2.4 全景视频的动态自适应传输技术
        2.4.1 MPEG-DASH传输系统
        2.4.2 MPEG-DASH结构内容描述
        2.4.3 MPEG-DASH空间关系描述
    2.5 小结
第三章 基于码流融合的全景视频自适应传输技术
    3.1 引言
    3.2 基于Tile的全景视频自适应传输系统
    3.3 改进的MCTS技术及其实现
        3.3.1 MCTS简介
        3.3.2 MCTS技术及实现
        3.3.3 性能测试及结果
    3.4 码流融合技术及其实现
        3.4.1 码流融合在实际场景中的应用
        3.4.2 码流融合技术
        3.4.3 性能测试及结果
    3.5 小结
第四章 基于Tile的全景视频快速视角切换方案
    4.1 引言
    4.2 基于Tile的全景视频视角切换方案
    4.3 基于码流组合的快速视角切换方案
    4.4 基于参考帧替换的快速视角切换方案
        4.4.1 基于参考帧替换的快速视角切换方案
        4.4.2 基于小角度视角切换的加速方案
    4.5 性能测试及结果
        4.5.1 快速视角切换方案的编码性能测试
        4.5.2 快速视角切换方案的性能评估
    4.6 小结
第五章 总结与展望
参考文献
致谢
作者简介

四、MPEG视频的发展趋势(论文参考文献)

  • [1]音视频文件的DNA数据存储编解码方法及其应用[D]. 肖焯. 中国科学院大学(中国科学院深圳先进技术研究院), 2021(08)
  • [2]基于媒体特征分析的自适应音视频水印关键技术研究[D]. 罗一帆. 四川大学, 2021(01)
  • [3]铁路综合视频监控系统升级优化的研究[D]. 杜玉敏. 兰州交通大学, 2020(02)
  • [4]基于客户端缓冲区状态的DASH码率选择算法研究[D]. 刘杰. 华中科技大学, 2020(01)
  • [5]高自由度视频编码及渲染关键技术研究[D]. 王彬. 浙江大学, 2020(02)
  • [6]视频编码标准帧间预测、码率控制及率失真优化技术研究[D]. 蒋妮. 电子科技大学, 2020(07)
  • [7]全景视频传输与关键算法优化研究[D]. 李逍. 上海交通大学, 2020(09)
  • [8]基于Android平台的MPEG-DASH流媒体QoE研究[D]. 周蓉蓉. 深圳大学, 2019(01)
  • [9]无线环境下基于DASH的流媒体传输算法研究与系统实现[D]. 付园鹏. 重庆邮电大学, 2019(02)
  • [10]基于Tile的全景视频自适应传输技术研究[D]. 张文杰. 西安电子科技大学, 2019(02)

标签:;  ;  ;  ;  ;  

MPEG视频的发展趋势
下载Doc文档

猜你喜欢