9月27日下午,计算机与信息科学学院在致用楼102学术会议厅举办第三期“图灵学术大讲堂”,华中科技大学教授喻莉应邀作题为《面向机器视觉的图像视频编码技术》的学术报告。计算机与信息科学学院党政领导班子、全体教师、研究生参加,会议由副院长崔少国主持。
报告中,喻莉首先基于自动驾驶、智慧城市、工业互联网等场景中的视频分析,对面向机器视觉的图像视频编码的研究背景进行阐释。她指出,面向人类的视频与面向机器的视频在应用场景、信息处理、编码和信息处理与使用上存在着差异。随后,她从VCM标准发展现状,Track-1特征压缩、Track-2 先压缩后分析的两条技术路线,以及MPEG143次会议中VCM最新进展等进行了详细介绍。她谈到,机器视觉编码是研究以智能应用为目标的压缩编码,在保障压缩率的同时,要做到计算机视觉任务的无损。提取到的压缩视频或特征码流可服务于多种机器任务,同时保障高压缩效率和机器智能任务性能。
同时,喻莉还介绍了三个核心任务(目标检测/实例分割/目标追踪)加两个主要评估数据集(OpenImageV6/TVD)。两条思路中两条标准里所提到的VCM架构,一个是根据特征来统计的压缩方法,另一个是将特征转换成图像,然后再进行图像压缩编码的压缩方法。对于特征压缩,一方面是现有的编解码方案,可以把它变成HEVC、VVC等;另一方面是新的技术方案,包括有特征变换,就是对统计特性进行视频域的分布的变换。最后,喻莉指明了面向机器视觉图像视频编码技术未来的努力方向。
交流环节,与会师生分别就机器视觉提取出的特征难以恢复,用该技术是否可以用于隐私的保护/多尺度特征提取的问题/如何区分出感兴趣区域等问题与喻莉教授进行了请教沟通。
报告前,学院还为喻莉教授举行了兼职教授授予仪式,并颁发“兼职教授”聘书。