基于深度学习的快速QTMT划分
与之前的编码标准相比,多功能视频编码(versatilevideocoding,VVC)进一步提高了压缩效率.嵌套多类树的四叉树(quadtree with nested multi-type tree,QTMT)结构是提高编码增益的关键之一,同时极大地增加了编码复杂度.为降低VVC编码复杂度,提出了一种基于深度学习的快速QTMT划分方法.首先,提出了注意力-非对称卷积结构来预测划分模式的概率.然后,基于阈值提出了快速划分模式决策.最后,提出了编码性能与时间的代价函数来求解最优阈值,提出了阈值决策方法.实验表明,算法在不同档次下的时间节省分别为48.62%、52.93%、62.01%,BDBR...
Saved in:
Published in | 电信科学 Vol. 37; no. 4; pp. 73 - 81 |
---|---|
Main Authors | , , , |
Format | Journal Article |
Language | Chinese |
Published |
中国通信学会
20.04.2021
人民邮电出版社有限公司 宁波大学信息科学与工程学院,浙江宁波 315211%宁波大学信息科学与工程学院,浙江宁波 315211 重庆理工大学电气与电子学院,重庆 400054%重庆理工大学电气与电子学院,重庆 400054 |
Subjects | |
Online Access | Get full text |
ISSN | 1000-0801 |
DOI | 10.11959/j.issn.1000-0801.2021062 |
Cover
Summary: | 与之前的编码标准相比,多功能视频编码(versatilevideocoding,VVC)进一步提高了压缩效率.嵌套多类树的四叉树(quadtree with nested multi-type tree,QTMT)结构是提高编码增益的关键之一,同时极大地增加了编码复杂度.为降低VVC编码复杂度,提出了一种基于深度学习的快速QTMT划分方法.首先,提出了注意力-非对称卷积结构来预测划分模式的概率.然后,基于阈值提出了快速划分模式决策.最后,提出了编码性能与时间的代价函数来求解最优阈值,提出了阈值决策方法.实验表明,算法在不同档次下的时间节省分别为48.62%、52.93%、62.01%,BDBR分别为1.05%、1.33%、2.38%.结果表明,算法的时间节省和率失真性能优于其他快速算法. |
---|---|
ISSN: | 1000-0801 |
DOI: | 10.11959/j.issn.1000-0801.2021062 |