VIDEO COMPRESSION BASED ON LONG RANGE END-TO-END DEEP LEARNING
At least a method and an apparatus are presented for efficiently encoding or decoding video. For example, a plurality of frames is provided to a motion estimator to produce an output comprising estimated motion information. The estimated motion information is provided to an auto-encoder or an auto-d...
Saved in:
Main Authors | , , |
---|---|
Format | Patent |
Language | English French |
Published |
25.03.2021
|
Subjects | |
Online Access | Get full text |
Cover
Loading…
Summary: | At least a method and an apparatus are presented for efficiently encoding or decoding video. For example, a plurality of frames is provided to a motion estimator to produce an output comprising estimated motion information. The estimated motion information is provided to an auto-encoder or an auto-decoder to produce an output comprising reconstructed motion field. The reconstructed motion field and one or more decoded frames of the plurality of frames are provided to a deep neural network to produce an output comprising refined bi-directional motion field. The video is encoded or decoded based on the refined bi-directional motion field.
L'invention concerne au moins un procédé et un appareil de codage ou de décodage efficaces de vidéo. Par exemple, une pluralité de trames est fournie à un estimateur de mouvement pour produire une sortie comprenant des informations de mouvement estimé. Les informations de mouvement estimé sont fournies à un auto-codeur ou à un auto-décodeur pour produire une sortie comprenant un champ de mouvement reconstruit. Le champ de mouvement reconstruit et au moins une trame décodée de la pluralité de trames sont fournis à un réseau neuronal profond pour produire une sortie comprenant un champ de mouvement bidirectionnel affiné. La vidéo est ensuite codée ou décodée en fonction du champ de mouvement bidirectionnel affiné. |
---|---|
Bibliography: | Application Number: WO2020US50892 |