新闻动态
江南(中国)官方在基于人眼视觉模型的高效视频编码研究方面取得新进展
作者:机器学习与跨媒体感知课题组    时间:2020-07-02    浏览量:

近期,由江南平台机器学习与跨媒体感知课题组青年教师周明亮博士为第一作者和通信作者、重庆大学为第一单位的论文《Just Noticeable Distortion-Based Perceptual Rate Control in HEVC》被计算机图形学与多媒体领域顶级学术期刊 IEEE Transactions on Image Processing (IEEE TIP) 录用 (CCF A类,JCR一区,最新影响因子9.34) 。该论文合作作者包括香港城市大学在读博士魏雪凯、Sam KWONG教授,上海交通大学贾维嘉教授、以及重庆大学房斌教授。

随着多媒体通信及网络技术的发展,人们对视频的应用需求越来越广泛,视频信息正对人们的生活方式和社会发展起着越来越重要的作用,与此同时,业界对于视频编码技术的要求也越来越高。2019年3月,工业和信息化部、国家广播电视总局、中央广播电视总台联合发布了《超高清视频产业发展行动计划(2019-2022年)》,明确提出将驱动视频行业智能化转型升级,提升我国信息产业和文化产业整体实力,培育经济新动能。在此背景下,该工作致力于视频编码领域中的关键技术——码率控制 (Rate Control, RC) 的研究,以期在带宽和存储容量受限的情况下,使编码器获得最佳的压缩效果,并保持一定的视频质量。

该研究面向海量视频数据的编码与传输,针对当前视频编码方案没有充分有效地利用人类视觉系统 (Human Vision System, HVS)的感知特性的挑战,首次提出了基于恰可察觉失真 (JND, Just Noticeable Distortion) 模型的单步码率控制算法。首先,使用平均像素级JND权重的近似值作为编码单元的JND因子,并用于码率控制。其次,基于JND因子进行合理的率失真 (Rate-Distortion, R-D) 建模,并利用KKT (Karush–Kuhn–Tucker) 条件获得编码参数的全局最优解。最后,将所提出的R-D模型集成到现有的High Efficiency Video Coding码率控制框架中。大量实验表明,与标准的High Efficiency Video Coding码率控制算法相比,该算法显著提升了编码性能,在降低码率的同时保持了视频的主观感知质量,相关工作的研究必将对视频编码产业的发展起到推动作用。

周明亮博士毕业于北京航空航天大学江南(中国)官方,导师为江南平台杰出校友李波教授,博士毕业后前往香港城市大学做博士后,师从Sam KWONG教授和贾维嘉教授,近年专注于先进视频编码的研究,围绕HDR,超高清视频等新型视频展开研究,已在IEEE TIPIEEE TCSVTIEEE TMMTOMM等重要国际期刊发表多篇重要的学术论文,取得了显著的科研成果,其多项研究成果已在实际系统中应用。

全文链接:https://ieeexplore.ieee.org/document/9130045/