Computació analògica en memòria: l'aposta per retallar la despesa energètica de la IA

  • La computació analògica en memòria promet reduir fins a mil vegades el consum energètic de la IA
  • L'enfocament AIMC permet emmagatzemar i processar dades al mateix xip, evitant trasllats constants d'informació
  • El mètode Residual Learning corregeix en temps real les imperfeccions del maquinari analògic durant l'entrenament
  • Aquesta tecnologia obre la porta a aplicacions de IA eficients en dispositius mèdics, wearables, indústria i robòtica

computació analògica

L'imparable desenvolupament de la intel·ligència artificial ha vingut acompanyat d'un problema que cada cop preocupa més la indústria: el elevat consum d'energia que impliquen tant l´entrenament com l´ús massiu dels grans models. Una sola consulta complexa en sistemes tipus ChatGPT pot arribar a gastar una quantitat delectricitat similar a la que utilitza una llar mitjana de Estats Units en un minut, una xifra que, multiplicada per milers de milions de peticions, dispara l'empremta ambiental.

Davant aquest escenari, investigadors i empreses tecnològiques busquen fórmules per aconseguir una IA molt més eficient i sostenible. Entre les alternatives que estan guanyant pes destaca la computació analògica en memòria (AIMC, per les sigles en anglès), un enfocament que proposa canviar d'arrel la manera com els xips emmagatzemen i processen la informació.

Què és la computació analògica en memòria i per què pot canviar les regles del joc

A les arquitectures digitals actuals, les dades es mouen contínuament entre la memòria i les unitats de processament. Aquesta anada i tornada consumeix temps i, sobretot, molta energia. La computació analògica en memòria planteja justament el contrari: que els dades romanguin al mateix lloc mentre es fan les operacions matemàtiques necessàries per executar els models d'IA.

Per aconseguir-ho, l'AIMC recorre a xips analògics capaços d'emmagatzemar i calcular de forma conjunta, aprofitant directament les propietats físiques del maquinari. En lloc de representar la informació únicament amb zeros i uns ben definits, el sistema utilitza senyals continus i les característiques elèctriques dels materials per dur a terme les operacions.

Segons feines recents liderades per l'investigador Tianyi Chen, en col·laboració amb equips de IBM i de l' Institut Politècnic de Rensselaer, aquest enfocament permetria reduir el consum energètic fins a mil vegades en comparació amb les plataformes digitals convencionals, mantenint alhora la capacitat d'executar models d'intel·ligència artificial de grans dimensions.

La clau és que, en no haver de desplaçar constantment la informació, el sistema pot “deixar que la física faci la feina”, utilitzant els propis polsos elèctrics i les respostes del material per resoldre operacions de forma pràcticament instantània. Aquest canvi de paradigma resulta especialment atractiu per a centres de dades i aplicacions amb un ús intensiu d'IA, també a Europa, on l'eficiència energètica ha esdevingut un factor estratègic.

Avantatges i límits del maquinari analògic per a intel·ligència artificial

La computació analògica en memòria no parteix de zero. Des de fa anys se sabia que aquest tipus de maquinari podia executar certs càlculs de manera molt ràpida i amb un consum reduït, cosa que la convertia en una opció interessant per accelerar la inferència de models ja entrenats. Tot i això, la seva aplicació a la fase d'entrenament havia resultat fins ara molt més complicada.

El principal escull és a les imperfeccions inherents al maquinari analògic. Els polsos que actualitzen els paràmetres del model poden variar lleugerament d'una operació a una altra, aparèixer soroll elèctric o produir petites desviacions que, acumulades, acaben perjudicant la qualitat de l'aprenentatge. Aquest comportament contrasta amb la precisió i repetibilitat del maquinari digital, on les operacions són més fàcils de controlar.

A la pràctica, aquestes limitacions es traduïen en gradients inexactes i entrenaments inestables, dos problemes que feien poc viable traslladar sense més ni més els algorismes clàssics d'aprenentatge automàtic als xips analògics. Tot i el potencial, l'AIMC quedava relegada a tasques molt concretes, lluny de l'objectiu d'entrenar grans models amb fiabilitat.

El treball de l'equip de Chen se centra precisament en aquest punt: com aprofitar la eficiència extrema del maquinari analògic sense renunciar a la precisió necessària perquè els models d'IA mantinguin la qualitat i la capacitat de generalització. La proposta consisteix a adaptar amb profunditat els algorismes d'entrenament a les característiques reals d'aquests sistemes físics.

Residual Learning: una versió analògica de la retropropagació

Per sortejar els problemes de precisió, el grup de recerca ha desenvolupat una reformulació analògica de l'algorisme de retropropagació, la tècnica més estesa per entrenar xarxes neuronals profundes. A aquesta variant l'han batejada com Residual Learning, un nom que fa referència a la idea d'anar corregint de manera constant els errors que es produeixen durant el procés d'actualització de paràmetres.

El mètode introdueix una capa addicional de control que supervisa com respon realment el maquinari a cada operació dentrenament. A partir d'aquesta informació, el sistema ajusta els gradients i compensa les desviacions causades pel soroll, els polsos irregulars o qualsevol altra imperfecció física, de manera que l'aprenentatge es mantingui al rumb previst.

Amb aquesta estratègia, s'aconsegueix que els models entrenats en xips analògics aconsegueixin una precisió molt propera a l'obtinguda en plataformes digitals, però amb una fracció de la despesa energètica. En essència, l'algorisme accepta que el maquinari no és perfecte i es dissenya per conviure amb aquestes imperfeccions, en comptes d'intentar ignorar-les.

L'equip defensa que aquesta aproximació no només millora l'estabilitat de l'entrenament, sinó que també introdueix un marc més sistemàtic per controlar la imparcialitat i el comportament estadístic dels models en entorns analògics. Això resulta especialment rellevant quan es pensa en aplicacions sensibles, en què els biaixos o els errors de predicció poden tenir conseqüències significatives.

Presentació a NeurIPS i reacció de la comunitat científica

Els resultats d'aquesta línia de treball es van presentar de forma destacada a la Conferència Anual sobre Sistemes de Processament d'Informació Neural (NeurIPS), un dels fòrums internacionals de referència en intel·ligència artificial. La ponència, celebrada al desembre, va generar interès per mostrar una via concreta per fer front al problema energètic sense dependre únicament de millores incrementals al maquinari digital.

Entre els aspectes més valorats per la comunitat hi ha la combinació de teoria daprenentatge automàtic i disseny de circuits, un terreny on la col·laboració entre universitats i empreses com IBM resulta clau. La investigació se situa en la intersecció entre la informàtica, la física i l'enginyeria electrònica, un espai on també hi ha centres europeus molt actius.

Tot i que gran part del desenvolupament experimental s'ha realitzat als Estats Units, l'impacte potencial és clarament global. El sector dels centres de dades a la Unió Europea, sotmès a regulacions cada cop més estrictes en matèria de consum energètic i emissions, mira amb atenció aquest tipus d'avenços, que podrien ajudar a complir els objectius de reducció de carboni sense frenar l'adopció de la IA.

D'acord amb els autors de l'estudi, el camí per davant passa per escalar els prototips, integrar l'enfocament en infraestructures existents i contrastar el rendiment amb models de codi obert utilitzats de forma generalitzada per la comunitat investigadora, cosa que facilitaria comparacions més transparents.

Aplicacions pràctiques: dels centres de dades als dispositius mèdics

Si la computació analògica en memòria aconsegueix consolidar-se, les repercussions es podrien notar en múltiples àmbits quotidians. En primer lloc, afectaria els grans centres de dades que alimenten serveis al núvol i assistents basats en IA, reduint els costos d'operació i la factura elèctrica associada a aquests sistemes.

Però un dels canvis més cridaners es donaria als entorns on l'energia disponible és molt limitada. Parlem de dispositius mèdics implantables o portàtils, tecnologia vestible, sensors distribuïts en fàbriques o infraestructures crítiques, i robots autònoms que necessiten funcionar durant llargs períodes amb bateries reduïdes.

En aquests escenaris, tenir xips capaços d'entrenar o reajustar models de manera local, amb un consum mínim, obriria la porta a aplicacions que avui són poc pràctiques. Per exemple, sistemes que aprenguin del propi pacient per adaptar tractaments o monitoritzar constants vitals de manera més personalitzada, sense enviar totes les dades al núvol.

En l'àmbit industrial, sensors i robots podrien prendre decisions més complexes a la vora de la xarxa, facilitant-ne una automatització més fina i flexible sense necessitat de recórrer constantment a servidors remots. Això encaixa amb les estratègies europees de digitalització i l'aposta per reduir la dependència d'infraestructures externes per a serveis crítics.

Des del punt de vista de l'usuari final, la millora es pot traduir en dispositius amb major autonomia de bateria i menys necessitat de connexió permanent, un aspecte que en el dia a dia és tan pràctic com invisible: el sistema simplement funcionaria més temps i de forma més silenciosa en termes de consum.

Propers passos i possibilitats per a Europa

L'equip liderat per Tianyi Chen ja ha assenyalat la intenció d'estendre l'enfocament de Residual Learning a un conjunt ampli de models de codi obert, el que permetria a altres grups reproduir els resultats i explorar noves variants adaptades a diferents tipus de maquinari analògic.

Paral·lelament, s'estan estudiant possibles col·laboracions amb la indústria per integrar aquests conceptes a plataformes comercials. Aquesta fase serà clau per saber si la computació analògica en memòria pot competir de tu a tu amb les solucions digitals d'alt rendiment que actualment dominen el mercat.

A Europa, on hi ha un interès creixent per reforçar la sobirania tecnològica i l'eficiència energètica, l'AIMC podria trobar un terreny fèrtil. Iniciatives relacionades amb xips de nova generació, infraestructures de supercomputació i projectes de IA de baix consum es podrien beneficiar de l'experiència acumulada en aquest tipus de desenvolupaments.

Alhora, quedaran per resoldre reptes importants, com la fabricació a gran escala de maquinari analògic fiable, l'estandardització d'eines de desenvolupament i la formació de perfils tècnics capaços de moure's amb facilitat entre la física del dispositiu i els algorismes d'aprenentatge profund.

La computació analògica en memòria s'està consolidant com una de les alternatives més serioses per retallar la despesa energètica associada a la intel·ligència artificial, mantenint unes prestacions competitives. Si les properes fases de recerca i desplegament confirmen les promeses inicials, podria convertir-se en una peça rellevant del puzle tecnològic amb què Europa i la resta del món intenten compatibilitzar l'expansió de la IA amb els objectius de sostenibilitat i reducció d'emissions.

OpenAI i Broadcom
Article relacionat:
L'aliança entre OpenAI i Broadcom per a xips d'IA personalitzats