Rețeaua IP neuronală a vizat procesarea SoCs a discursului complex
Resursele sunt suficiente pentru recunoașterea vocii de la distanță, în cazul în care utilizatorul este la câțiva metri distanță de microfon. Ajutoarele digitale de acasă controlate de voce și infotainmentul auto sunt destinate aplicațiilor.
De ce se procesează discursul pe PCB-ul local?
"Algoritmii de recunoaștere a vorbirii bazate pe rețeaua neurală efectuează mai multe sarcini pe plan local decât pe cloud, din cauza preocupărilor legate de latență, confidențialitate și disponibilitatea rețelei", a spus Cadence.
Numit HiFi 5, are de două ori capacitatea de procesare audio și de patru ori prelucrarea rețelei neuronale (NN) a fostului HiFi 4 DSP.
"Scopul nostru este de a face disponibil un motor de vocabular pe scară largă, capabil să proceseze limba naturală", a declarat directorul de marketing Cadence, Gerard Andrews, pentru Electronics Weekly. "Am cercetat rețele neuronale de recunoaștere a vorbirii open-source și am proiectat HiFi 5 pentru a rula acele tipuri de rețele.
Elementele de procesare includ:
- Cinci arhitecturi de cuvânt cu instrucțiuni foarte lungi (VLIW) care pot emite două încărcări pe 128 de biți pe ciclu
- Amplificatoare-acumulatori DSP:
Suport pentru 8 32x32bit MAC / ciclu sau 16 16x16bit MAC / ciclu
Opțional opt MAC-uri cu o singură precizie pe ciclu - Rețele neuronale-acumulatoare multiplicatoare:
32 16 × 8 MAC / ciclu sau 16 × 4 MAC / ciclu
Opțional 16 MAC-uri cu virgulă mobilă pe jumătate de precizie pe ciclu
DSP-urile MAC, conform lui Andrews, includ, de exemplu, suport pentru saturație, în timp ce MAC-urile rețelei neuronale sunt optimizate pentru a multiplica o valoare vectorică printr-o matrice. "În atâtea rețele neuronale, veți ajunge să cheltuiți o cantitate imensă de timp înmulțind un vector cu o matrice", a spus el, adăugând că: alegerea a câți MAC-uri să includă și ce tipuri de date și lungimi de greutate pentru a sprijini, a fost bazat pe lucrul cu clienții HiFi 4.
Valorile matematice cu punct de plutire au fost încorporate pentru două cazuri de utilizare - o singură precizie pentru frontul vocal pentru formarea fasciculului și anularea ecoului, și jumătate de precizie pentru unele rețele neuronale. "Punctul plutitor oferă un timp rapid pentru piață", a spus Andrews. "De exemplu, dacă dezvoltați ceva floating în MatLab, convertirea la punct fix este destul de consumatoare de timp".
Multiplicatorul suportă greutăți de 8 biți, deoarece "tendința majoră este de a cuantifica până la greutăți de 8 biți pentru recunoașterea vorbirii, care nu trebuie să compromită prea mult acuratețea. Puteți vedea lucrări prezentate în cazul în care oamenii încearcă să meargă până la 4bits ", a spus Andrews. "Anticipăm că majoritatea algoritmilor vor beneficia de multiplicatorul 16x8bit: 16 biți pentru date de la microfon și 8 biți pentru greutăți".

Pentru alte scheme de ponderare, sunt disponibile 4bit, 2bit și 1bit, precum și 8bit.
Ambiq Micro, producător de microcontrolere construit pe procese de siliciu "sub prag" pentru economisirea energiei, a fost primul client HiFi 5.
"Pentru a face față provocării extrem de dificile de a introduce algoritmi de procesare a câmpurilor de mare intensitate și algoritmi de recunoaștere vocală bazate pe rețele neuronale, Ambiq Micro a ales să fie primul licențiat de siliciu al HiFi 5 DSP al Cadence", a declarat Ambiq vp de marketing Aaron Grassian. "Portarea HiFi 5 DSP pe platforma Ambiq Micro sub-prag optimizată de putere permite designerilor, ODM-urilor și OEM-urilor să profite la maxim de tehnologia liderilor de software audio precum Concepte DSP și Sensory prin adăugarea integrării, comenzii și controlului asistenței vocale și conversații UI la produse portabile, mobile fără a sacrifica calitatea sau durata de viață a bateriei. "
Sprijinind proprietatea intelectuală, există o bibliotecă de funcții de bibliotecă optimizate utilizate în mod obișnuit în procesarea rețelelor neuronale - în special pentru prelucrarea vorbirii. Aceste funcții vizează integrarea în cadrele populare de învățare automată.
Hifi 5 este, de asemenea, compatibil cu bibliotecile firmelor existente în codecuri audio și vocale și pachete de software pentru îmbunătățirea sunetului, optimizate pentru versiunile anterioare ale gamei HiFi a firmei.
