Fasciculatorul de rețea neurală bazat pe FPGA depășește performanțele unităților de procesare grafică
A fost demonstrată ca CNN CNC Utilizare Inception-v1, utilizând o rezoluție întregă de opt biți. A obținut 16,8 terra operațiuni pe secundă (TOPS) și poate deduce peste 5300 de imagini pe secundă pe Xilinx Virtex UltraScale + XCVU9P-3 fpga. Abordarea modulară și scalabilă îl face potrivită pentru detectarea obiectelor și pentru aplicațiile de procesare video la margine și în nor, a explicat Fawcett, precum și pentru inferența în centrele de date și în camerele inteligente.
DPU poate fi configurat pentru a oferi o performanță optimă a calculului pentru topologiile rețelei neuronale în aplicațiile de învățare mecanică, folosind arhitectura DSP paralelă, memoria distribuită și reconfigurabilitatea logicii și conectivității pentru diferiți algoritmi.
DPU atinge performanțe de peste 50% mai mari decât orice CNN concurente și depășește GPU-urile pentru un anumit buget de putere sau cost, afirmă compania. "FPGA este o platformă și o arhitectură bătută în lumea întreagă, care este foarte flexibilă pentru protecția în viitor și poate depăși GPU-urile în AI, cu o latență mai mică", a adăugat Fawcett.
Compania a anuntat, de asemenea, ca sponsorizeaza un DPhil (PhD0 la Universitatea Oxford pentru a studia tehnici de implementare a acceleratiilor de invatare profunda pe fpgas). Lucrarea va fi in colaborare cu cercetarile proprii ale Omnitek in motoarele si algoritmii computerizati AI.
