IMAGE ENCODING DEVICE, IMAGE DECODING DEVICE, IMAGE PROCESSING SYSTEM, MODEL LEARNING DEVICE, IMAGE ENCODING METHOD, IMAGE DECODING METHOD, AND COMPUTER-READABLE STORAGE MEDIUM
In the present invention, a first machine learning model is used on image data to extract context information indicating characteristics of the image data, a second machine learning model is used on the context information to determine parameters for a third machine learning model, the third machine...
Saved in:
Main Authors | , , , , |
---|---|
Format | Patent |
Language | English French Japanese |
Published |
25.04.2024
|
Subjects | |
Online Access | Get full text |
Cover
Loading…
Summary: | In the present invention, a first machine learning model is used on image data to extract context information indicating characteristics of the image data, a second machine learning model is used on the context information to determine parameters for a third machine learning model, the third machine learning model is used on the image data to generate compressed data having a smaller amount of information than the image data, and the context information and the compressed data are encoded to generate a code sequence. The context information and the compressed data are decoded from the code sequence, a fourth machine learning model is used on the context information to determine parameters for a fifth machine learning model, and the fifth machine learning model is used on the compressed data to generate restored data.
Dans la présente invention, un premier modèle d'apprentissage automatique est utilisé sur des données d'image pour extraire des informations de contexte indiquant des caractéristiques des données d'image, un deuxième modèle d'apprentissage automatique est utilisé sur les informations de contexte pour déterminer des paramètres pour un troisième modèle d'apprentissage automatique, le troisième modèle d'apprentissage automatique est utilisé sur les données d'image pour générer des données compressées possédant une plus petite quantité d'informations que les données d'image, et les informations de contexte et les données compressées sont codées pour générer une séquence de code. Les informations de contexte et les données compressées sont décodées à partir de la séquence de code, un quatrième modèle d'apprentissage machine est utilisé sur les informations de contexte pour déterminer des paramètres pour un cinquième modèle d'apprentissage machine, et le cinquième modèle d'apprentissage machine est utilisé sur les données compressées pour générer des données restaurées.
画像データに対して第1機械学習モデルを用いて前記画像データの特徴を示すコンテキスト情報を抽出し、前記コンテキスト情報に対して第2機械学習モデルを用いて第3機械学習モデルのパラメータを決定し、前記画像データに対して第3機械学習モデルを用いて前記画像データよりも情報量が少ない圧縮データを生成し、前記コンテキスト情報と前記圧縮データを符号化し、符号系列を生成する。符号系列からコンテキスト情報と圧縮データを復号し、前記コンテキスト情報に対して第4機械学習モデルを用いて第5機械学習モデルのパラメータを決定し、前記圧縮データに前記第5機械学習モデルを用いて復元データを生成する。 |
---|---|
Bibliography: | Application Number: WO2022JP39119 |