TRANSPONIERTE FALTUNG MIT SYSTOLISCHEM ARRAY
In einem Beispiel kann ein Neuronalnetzwerk-Beschleuniger einen Satz von Befehlen ausführen, um: ein erstes Gewichtungsdatenelement aus einem Speicher in ein systolisches Array zu laden, wobei das erste Gewichtungsdatenelement erste Koordinaten aufweist; Informationen aus den Befehlen, zu extrahiere...
Saved in:
Main Authors | , |
---|---|
Format | Patent |
Language | German |
Published |
04.08.2022
|
Subjects | |
Online Access | Get full text |
Cover
Loading…
Summary: | In einem Beispiel kann ein Neuronalnetzwerk-Beschleuniger einen Satz von Befehlen ausführen, um: ein erstes Gewichtungsdatenelement aus einem Speicher in ein systolisches Array zu laden, wobei das erste Gewichtungsdatenelement erste Koordinaten aufweist; Informationen aus den Befehlen, zu extrahieren, die eine erste Teilmenge von Eingabedatenelementen angeben, die aus dem Speicher abzurufen sind, wobei die erste Teilmenge auf einer Schrittweite einer transponierten Faltungsoperation und zweiten Koordinaten des ersten Gewichtungsdatenelements in einem gedrehten Array von Gewichtungsdatenelementen basiert; auf der Grundlage der Informationen die erste Teilmenge von Eingabedatenelementen aus dem Speicher abzurufen; die erste Teilmenge von Eingabedatenelementen in das systolische Array zu laden; und das systolische Array zu steuern, um erste Berechnungen auf der Grundlage des ersten Gewichtungsdatenelements und der ersten Teilmenge von Eingabedatenelementen durchzuführen, um Ausgabedatenelemente eines Arrays von Ausgabedatenelementen zu erzeugen.
In one example, a neural network accelerator can execute a set of instructions to: load a first weight data element from a memory into a systolic array, the first weight data element having first coordinates; extract, from the instructions, information indicating a first subset of input data elements to be obtained from the memory, the first subset being based on a stride of a transposed convolution operation and second coordinates of first weight data element in a rotated array of weight data elements; based on the information, obtain the first subset of input data elements from the memory; load the first subset of input data elements into the systolic array; and control the systolic array to perform first computations based on the first weight data element and the first subset of input data elements to generate output data elements of an array of output data elements. |
---|---|
Bibliography: | Application Number: DE20201104625T |