COMPRESSION TECHNIQUE FOR DEEP NEURAL NETWORK WEIGHTS

Various embodiments include methods and devices for compression and decompression of weight data sets. Some embodiments may include compressing weight data by receiving a weight data set of binary numbers representing weight values, generating a frame payload including a compressed first frame of a...

Full description

Saved in:
Bibliographic Details
Main Authors MACHA, Lakshmi Narayana, KULKARNI, Prajakt, XU, Haoping
Format Patent
LanguageEnglish
French
Published 06.10.2022
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:Various embodiments include methods and devices for compression and decompression of weight data sets. Some embodiments may include compressing weight data by receiving a weight data set of binary numbers representing weight values, generating a frame payload including a compressed first frame of a first subset of the weight values in the weight data set, and generating a block of compressed weight data having the frame payload. Some embodiments may include decompressing weight data by retrieving a block of compressed weight data, in which the block of compressed weight data includes a frame header associated with a frame payload, in which the frame header includes a normalization factor indicator, and in which the frame payload includes compressed weight values, and generating a first decompressed frame comprising decompressed weight values of the compressed weight values of the frame payload. Divers modes de réalisation concernent des procédés et des dispositifs de compression et de décompression d'ensembles de données de poids. Certains modes de réalisation peuvent consister à compresser des données de poids par réception d'un ensemble de données de poids de nombres binaires représentant des valeurs de poids, par génération d'une charge utile de trames comprenant une première trame compressée d'un premier sous-ensemble des valeurs de poids dans l'ensemble de données de poids, et par génération d'un bloc de données de poids compressées comportant la charge utile de trames. Certains modes de réalisation peuvent consister à décompresser des données de poids par extraction d'un bloc de données de poids compressées, le bloc de données de poids compressées comprenant un en-tête de trame associé à une charge utile de trames, l'en-tête de trame comprenant un indicateur de facteur de normalisation, et la charge utile de trames comprenant des valeurs de poids compressées, et par génération d'une première trame décompressée comprenant des valeurs de poids décompressées des valeurs de poids compressées de la charge utile de trames.
Bibliography:Application Number: WO2022US22497