基于深度学习的快速QTMT划分

与之前的编码标准相比,多功能视频编码(versatilevideocoding,VVC)进一步提高了压缩效率.嵌套多类树的四叉树(quadtree with nested multi-type tree,QTMT)结构是提高编码增益的关键之一,同时极大地增加了编码复杂度.为降低VVC编码复杂度,提出了一种基于深度学习的快速QTMT划分方法.首先,提出了注意力-非对称卷积结构来预测划分模式的概率.然后,基于阈值提出了快速划分模式决策.最后,提出了编码性能与时间的代价函数来求解最优阈值,提出了阈值决策方法.实验表明,算法在不同档次下的时间节省分别为48.62%、52.93%、62.01%,BDBR...

Full description

Saved in:
Bibliographic Details
Published in电信科学 Vol. 37; no. 4; pp. 73 - 81
Main Authors 彭双, 王晓东, 彭宗举, 陈芬
Format Journal Article
LanguageChinese
Published 中国通信学会 20.04.2021
人民邮电出版社有限公司
宁波大学信息科学与工程学院,浙江宁波 315211%宁波大学信息科学与工程学院,浙江宁波 315211
重庆理工大学电气与电子学院,重庆 400054%重庆理工大学电气与电子学院,重庆 400054
Subjects
Online AccessGet full text
ISSN1000-0801
DOI10.11959/j.issn.1000-0801.2021062

Cover

More Information
Summary:与之前的编码标准相比,多功能视频编码(versatilevideocoding,VVC)进一步提高了压缩效率.嵌套多类树的四叉树(quadtree with nested multi-type tree,QTMT)结构是提高编码增益的关键之一,同时极大地增加了编码复杂度.为降低VVC编码复杂度,提出了一种基于深度学习的快速QTMT划分方法.首先,提出了注意力-非对称卷积结构来预测划分模式的概率.然后,基于阈值提出了快速划分模式决策.最后,提出了编码性能与时间的代价函数来求解最优阈值,提出了阈值决策方法.实验表明,算法在不同档次下的时间节省分别为48.62%、52.93%、62.01%,BDBR分别为1.05%、1.33%、2.38%.结果表明,算法的时间节省和率失真性能优于其他快速算法.
ISSN:1000-0801
DOI:10.11959/j.issn.1000-0801.2021062