HARDWARE-AWARE GENERATION OF MACHINE LEARNING MODELS

This document relates to automated generation of machine learning models, such as neural networks. One example method involves obtaining a first machine learning model having one or more first inference operations. The example method also involves identifying a plurality of second inference operatio...

Full description

Saved in:
Bibliographic Details
Main Authors DEKEL, Ofer, KIRSHENBOIM, Gilad, DEY, Debadeepta, RAVGAD, Segev, SHAH, Shital
Format Patent
LanguageEnglish
French
Published 10.05.2024
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:This document relates to automated generation of machine learning models, such as neural networks. One example method involves obtaining a first machine learning model having one or more first inference operations. The example method also involves identifying a plurality of second inference operations that are supported by an inference hardware architecture. The example method also involves generating second machine learning models by modifying the first machine learning model to include individual second inference operations that are supported by the inference hardware architecture. The example method also involves selecting a final machine learning model from the second machine learning models based on one or more metrics. L'invention concerne la génération automatisée de modèles d'apprentissage automatique, tels que des réseaux neuronaux. Un procédé donné à titre d'exemple consiste à obtenir un premier modèle d'apprentissage automatique ayant une ou plusieurs premières opérations d'inférence. Le procédé donné à titre d'exemple consiste également à identifier une pluralité de secondes opérations d'inférence qui sont prises en charge par une architecture matérielle d'inférence. Le procédé donné à titre d'exemple consiste également à générer des seconds modèles d'apprentissage automatique par modification du premier modèle d'apprentissage automatique pour inclure des secondes opérations d'inférence individuelles qui sont prises en charge par l'architecture matérielle d'inférence. Le procédé donné à titre d'exemple consiste également à sélectionner un modèle d'apprentissage automatique final à partir des seconds modèles d'apprentissage automatique sur la base d'une ou de plusieurs métriques.
Bibliography:Application Number: WO2023US33653