VIDEO COMPRESSION BASED ON LONG RANGE END-TO-END DEEP LEARNING

At least a method and an apparatus are presented for efficiently encoding or decoding video. For example, a plurality of frames is provided to a motion estimator to produce an output comprising estimated motion information. The estimated motion information is provided to an auto-encoder or an auto-d...

Full description

Saved in:
Bibliographic Details
Main Authors PHAM, Hien, BEGAINT, Jean, GALPIN, Franck
Format Patent
LanguageEnglish
French
Published 25.03.2021
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:At least a method and an apparatus are presented for efficiently encoding or decoding video. For example, a plurality of frames is provided to a motion estimator to produce an output comprising estimated motion information. The estimated motion information is provided to an auto-encoder or an auto-decoder to produce an output comprising reconstructed motion field. The reconstructed motion field and one or more decoded frames of the plurality of frames are provided to a deep neural network to produce an output comprising refined bi-directional motion field. The video is encoded or decoded based on the refined bi-directional motion field. L'invention concerne au moins un procédé et un appareil de codage ou de décodage efficaces de vidéo. Par exemple, une pluralité de trames est fournie à un estimateur de mouvement pour produire une sortie comprenant des informations de mouvement estimé. Les informations de mouvement estimé sont fournies à un auto-codeur ou à un auto-décodeur pour produire une sortie comprenant un champ de mouvement reconstruit. Le champ de mouvement reconstruit et au moins une trame décodée de la pluralité de trames sont fournis à un réseau neuronal profond pour produire une sortie comprenant un champ de mouvement bidirectionnel affiné. La vidéo est ensuite codée ou décodée en fonction du champ de mouvement bidirectionnel affiné.
Bibliography:Application Number: WO2020US50892