Design of a Low Power and Area Efficient Bfloat16 based Generalized Systolic Array for DNN Applications

Show simple item record Tiwari, Ankita Mishra, Saras Mani Guha, Prithwijit Pidanič, Jan Němec, Zdeněk Trivedi, Gaurav 2023-07-12T13:18:48Z 2023-07-12T13:18:48Z 2022
dc.identifier.isbn 978-1-72818-686-3
dc.description.abstract Nowadays demand for artificial intelligence (AI) enabled mobile platforms is increasing. From healthcare services to defense and from remote to urban area, there is a huge demand of secured and power efficient devices. The performance of these platforms can be enhanced by providing an efficient compute engine. These compute engines perform a huge amount of matrix operations. The most popular choice for large matrix computation is a systolic array. In general, the systolic array performance degrades for the large input matrices, due to the trade off between resource utilization and computation delay. To address this issue, we need a systolic array with a control unit to re-configure the array according to the requirement of the computation. Computation array can be further improved by handling the negative weights and reduce the MAC operations. In this paper, we proposed a generalized bfloat16 based systolic array in which the sign of the partial sum (PS) is predicted before computation. The PS sign aids in network pruning which enhances system performance. The proposed system is implemented on a Virtex-7 FPGA board and it performs 2.21 similar to and 4.19x better in terms of area and power compared to single-precision based systolic array. eng
dc.format p. 44-48 eng
dc.language.iso eng
dc.publisher IEEE eng
dc.rights open access (green) eng
dc.subject systolic eng
dc.subject floating-point number system eng
dc.subject Bfloat16 eng
dc.subject DNN eng
dc.subject systolický cze
dc.subject číselný systém s plovoucí desetinnou čárkou cze
dc.subject Bfloat16 cze
dc.subject DNN cze
dc.title Design of a Low Power and Area Efficient Bfloat16 based Generalized Systolic Array for DNN Applications eng
dc.title.alternative Návrh zobecněného systolického pole na bázi Bfloat16 s nízkou spotřebou energie a efektivní plochou pro aplikace DNN cze
dc.type ConferenceObject eng
dc.description.abstract-translated V současné době roste poptávka po mobilních platformách s umělou inteligencí (AI). Od zdravotnických služeb až po obranu a od vzdálených až po městské oblasti existuje obrovská poptávka po zabezpečených a energeticky účinných zařízeních. Výkon těchto platforem lze zvýšit poskytnutím efektivního výpočetního jádra. Tyto výpočetní motory provádějí obrovské množství maticových operací. Nejoblíbenější volbou pro velké maticové výpočty je systolické pole. Obecně platí, že výkonnost systolického pole se pro velké vstupní matice zhoršuje v důsledku kompromisu mezi využitím prostředků a zpožděním výpočtu. K řešení tohoto problému potřebujeme systolické pole s řídicí jednotkou, která by změnila konfiguraci pole podle požadavku výpočtu. Výpočetní pole lze dále vylepšit zpracováním záporných vah a omezit operace MAC. V tomto článku jsme navrhli zobecněné systolické pole založené na bfloat16 , ve kterém se před výpočtem předpovídá znaménko částečného součtu (PS). Znaménko PS pomáhá při ořezávání sítě, což zvyšuje výkonnost systému. Navržený systém je implementován na desce Virtex-7 FPGA a ve srovnání se systolickým polem založeným na jedné přesnosti má výkon 2,21 podobný a 4,19x lepší z hlediska plochy a výkonu. cze
dc.event 32nd International Conference on Radioelectronics (RADIOELECTRONICS) (21.04.2022 - 22.04.2022, Kosice) eng
dc.peerreviewed yes eng
dc.publicationstatus postprint (accepted version) eng
dc.identifier.doi 10.1109/RADIOELEKTRONIKA54537.2022.9764899
dc.project.ID LTAIN19100/Vývoj bezkontaktní technologie pro inteligentní ochranu zájmových prostor cze
dc.identifier.wos 000856002200011
dc.identifier.scopus 2-s2.0-85130107446
dc.identifier.obd 39888114

This item appears in the following Collection(s)

Show simple item record

Search DSpace

Advanced Search


My Account