fbpx

Entrevista a Pau Bramon, enginyer

En Pau Bramon va estudiar Enginyeria Superior de Telecomunicacions i, després de treballar en la indústria de l’automatització, es va especialitzar amb un màster d’Intel·ligència Artificial. Actualment treballa a Indeep, una empresa que vam fundar el 2019 i que aporta solucions de visió artificial per a la indústria utilitzant Intel·ligència Artificial. Aquests dies havia de pronunciar una xerrada sobre el tema a Els grans interrogants de la ciència.

Què és la intel·ligència artificial?

En poques paraules, la intel·ligència artificial és el camp que intenta dotar a les màquines de capacitat de pensar o entendre com ho fem els humans. Això no vol dir crear màquines totalment autònomes i capaces de fer-ho tot com nosaltres, però sí que vol dir fer certes tasques que potser el nostre cervell fa gairebé sense esforç, però que no són de cap manera trivials. En general, en programació, necessitem descriure tots els casos i condicions que poden passar per decidir els passos que farà el programa (si passa A, el programa farà B, si no farà C), però hi ha certes tasques que són impossibles de definir d’aquesta forma. En aquestes tasques és on entra la intel·ligència artificial i on els últims anys ha tingut grans avenços.

L’exemple més clar és probablement la comprensió d’imatges. Els humans estem contínuament analitzant el que veuen els nostres ulls i ho fem extraordinàriament bé, però la tasca en si mateixa és extremadament complexa. Imaginem, per exemple, que estem creant un sistema de pilot automàtic per un cotxe autònom. Per poder conduir, posem una càmera davant del cotxe que vegi el que veuria el conductor i intentem crear un programa que a partir de les imatges giri el volant, freni o acceleri. Simplificant molt, una de les primeres coses que hauríem de fer és detectar si tenim un cotxe al davant o no per poder frenar. Imaginem per un moment què significa crear un sistema capaç de fer això: necessitem trobar, en una imatge, un cotxe que pot ser de qualsevol model del mercat (des d’un Seat Ibiza del 90, fins a un BMW X7 del 2020), que pot estar conduint en qualsevol condició meteorològica (de dia o de nit, plovent, amb boira…) i que el mateix cotxe pot estar en qualsevol estat (net i en perfectes condicions, o ple de fang i abonyegat). Imaginem com pot arribar a canviar la imatge encara que només es tracti de veure un simple cotxe!

Encara que nosaltres entenem aquestes imatges com coses semànticament similars, a nivell de píxels aquestes no tenen absolutament res a veure. És més, nosaltres podem veure un model de cotxe per primera vegada a la vida i sabem que és un cotxe a l’instant. En programació, això és totalment impossible, necessitem alguna eina més.

Aquí és on entra en joc el que fa uns anys ha causat aquest boom de la Intel·ligència Artificial: el Deep Learning. La idea és, en lloc de definir manualment les condicions i accions del nostre programa, aconseguir un model que sigui capaç d’aprendre-les automàticament. En concret, el model per excel·lència que ha aconseguit increïbles resultats ha sigut el que s’anomenen Xarxes Neuronals, que imita de manera molt simplificada la forma com funciona un cervell biològic.

He de fer un petit aclariment. Encara que aquesta moda de la Intel·ligència Artificial és causada per l’aparició del Deep Learning i les Xarxes Neuronals, el camp és molt més ampli i fa molts més anys que existeix. La Intel·ligència Artificial va molt més enllà i hi ha molts grups de recerca que hi treballen fent servir altres tècniques completament diferents (i en alguns casos amb resultats similars o millors).

Pels que no en sabem gens, com funcionen aquestes Xarxes Neuronals?

És molt difícil explicar això en poques paraules, però vindria a ser un model que intenta copiar la forma com el nostre cervell és capaç d’aprendre. A grans trets, sabem que un cervell biològic consisteix en una gran quantitat de neurones interconnectades entre elles. Per tal d’aprendre coses noves, sabem que aquestes connexions entre neurones, anomenades sinapsis, varien la intensitat i la forma que transmeten els senyals. És a dir, que el coneixement s’emmagatzema de forma distribuïda en tota la xarxa canviant les connexions entre les neurones.

En els models de Xarxes Neuronals que utilitzem en la Intel·ligència Artificial intentem copiar aquesta forma d’emmagatzemar informació, creant neurones artificials i connexions que siguin també modificables. Els nostres cervells artificials són una simplificació molt gran del que passa realment en un cervell, però permeten crear màquines capaces d’aprendre.

L’exemple que he explicat abans del sistema de visió per detectar si hi ha un cotxe al davant es podria solucionar perfectament fent servir aquestes xarxes artificials. Com ho faríem? En primer lloc, crearíem el model d’un cervell disposant en software un seguit de neurones connectades entre elles. Aquest cervell no existiria físicament, sinó que simplement serien milions i milions de variables preparades en la memòria de l’ordinador a punt per ser utilitzades. Llavors, a aquest cervell li mostraríem imatges de carreteres amb cotxes i sense cotxes, i miraríem quin resultat dona. En funció de si el resultat és correcte o no, ajustaríem les connexions entre neurones per intentar cometre menys errors les següents vegades. Inicialment, les connexions entre neurones serien totalment inventades i, per tant, el nostre cervell seria totalment estúpid. Però a mesura que anéssim ensenyant-li imatges i ajustant-ne les connexions, el cervell començaria a funcionar. Amb prou imatges i temps, el cervell podria acabar fent la tasca igual de bé que un humà.

Per què, de cop, sembla que és molt més present?

La veritat és que el Deep Learning i les Xarxes Neuronals han aconseguit aquesta última dècada resultats increïbles. Tot i que les Xarxes Neuronals fa molt temps que existeixen (des dels anys 40), fa relativament poc que s’ha aconseguit explotar el seu potencial. Les raons d’aquest canvi són varies, però a grans trets:

  • En primer lloc la mateixa llei de Moore. Per tal que les Xarxes Neuronals funcionin correctament, cal que els ordinadors tinguin en memòria i modifiquin milions i milions de variables simulant ser neurones i sinapsis. Això és tecnològicament costós i la simple evolució dels ordinadors ho ha acabat fent possible.
  • En segon lloc, la disponibilitat de les dades. Com he explicat, les nostres xarxes s’alimenten de dades per aprendre a realitzar tasques noves. Actualment, amb l’explosió d’Internet i les xarxes socials, ens trobem clarament a l’era de les dades i, per tant, el Deep learning té tot el combustible que vol per poder funcionar.
  • En tercer lloc, algunes empreses hi han vist el potencial (especialment l’econòmic). Per aconseguir crear i entrenar aquestes xarxes es necessita hardware molt potent i software prou optimitzat. El fet que empreses de hardware (Nvidia, Intel…) i de software (Google, Facebook…) hi hagin dedicat recursos ha fet que el camp evolucionés molt més ràpid. Aquestes empreses han provocat que la recerca s’hi bolqués i han aplanat el camí perquè altres empreses més petites o inclús startups hi entressin.
És una moda o és realment el futur?

És innegable que el que s’ha aconseguit en els últims deu anys és una autèntica revolució tecnològica! No hi ha cap dubte que el què es pot aconseguir ara fent servir el Deep Learning era absolutament impensable pocs anys enrere. Per tant, no tinc cap dubte que marcarà clarament el futur, no només tecnològic, sinó social.

Dit això, està clar que també té part de bombo. Quan una tecnologia està de moda, les empreses intenten adoptar-la encara que només sigui per qüestions de màrqueting. Amb la Intel·ligència Artificial ha passat exactament el mateix i, últimament, sembla que fins i tot les fleques utilitzin IA per tallar el pa.

També cal tenir present una altra cosa: no tot el que surt a les notícies és cert del tot. Quan veiem notícies que parlen d’avenços futuristes en la IA, hem de tenir present que moltes vegades hi ha interessos pel mig i que, per tant, aquests avenços estan molt magnificats. La intel·ligència artificial té molt potencial, però estem lluny de veure Terminator entrar per la porta.

Tenim sobretot al cap els cotxes i els assistents de veu, quins altres usos tenim ja al nostre abast i quins arribarem a tenir?

Jo crec que els cotxes autònoms i els assistents de veu són probablement els usos més vistosos, però hem de pensar que la majoria de tecnologia que necessiti prendre decisions intel·ligents acabarà funcionant utilitzant Deep Learning. Actualment ja tenim integrada aquesta tecnologia en gran part del software que consumim i probablement no ens n’adonem. Quan utilitzem el traductor de Google, quan Spotify ens recomana un artista nou o quan ens surten bàners mentre naveguem per internet, tot això està alimentat amb Deep Learning. Jo diria que no ens n’hem adonat, però hi ha certes aplicacions, que fa molt temps que utilitzem, que tot d’una funcionen molt i molt millor degut a la IA.

En un futur? Podria posar diversos exemples:

  • La indústria probablement experimentarà els canvis més importants. Els processos industrials tenen tasques molt repetitives però que fins al moment han set complexes d’automatitzar. En aquest sector, la IA tindrà una influència molt gran i moltes d’aquestes tasques es podran automatitzar completament. Això segur que revolucionarà la producció industrial, però segurament també provocarà canvis importants en la societat en general.
  • Un altre camp en què estan apareixent noves aplicacions que utilitzen IA és el camp de les càmeres de seguretat i control. Utilitzant Deep Learning és possible analitzar vídeos de forma bastant acurada, detectant accions o persones sospitoses. La Xina ja està aplicant aquesta tecnologia per fer control massiu de la població i, aquí, empreses de seguretat privada ja comencen a oferir serveis de seguretat amb IA.
  • Una última aplicació curiosa podria ser l’ús de la IA per l’edició d’imatge i vídeo. El Deep Learning ja ha demostrat ser una eina molt potent per fer edició de vídeo o tractament d’imatge. Crec que tant productores de cinema com creadores de videojocs aprofitaran aquesta tecnologia per oferir-nos productes molt més espectaculars. Un exemple molt simple que ja s’està aplicant és l’edició de vídeos antics que eren en blanc i negre per transformar-los a color de forma natural. Però les possibilitats en aquest camp són infinites.
Els que diuen que les màquines substituiran les persones, tenen raó?

Jo no tinc una visió gens catastrofista en aquest sentit:

  • En primer lloc, crec que tot i que moltes més feines es podran automatitzar, en cap cas es podrà automatitzar tot. La IA que tenim actualment funciona bé realitzant tasques molt concretes que siguin repetitives, però no és capaç de funcionar com els humans en tasques més complexes o que requereixin habilitats socials. Alexa (l’assistent de veu d’Amazon) és capaç de comprendre bé instruccions clares, però no va molt més enllà. És a dir, li pots demanar que et compri llet, però no li pots explicar que avui estàs deprimit perquè la xicota t’ha deixat.
  • En segon lloc, si no hi ha prou feina perquè tothom pugui fer la jornada laboral actual, aquesta de ben segur que canviarà. Ara sembla que sempre hem tingut la jornada laboral de 8 hores i que sempre hem treballat cinc dies a la setmana per dos de festa, però això tampoc ha estat així. La societat s’ha adaptat a grans canvis tecnològics en el passat i res em fa pensar que no es pugui adaptar a un nou canvi més. Sense anar més lluny, cada vegada sona amb més força la idea d’una jornada laboral més curta.
  • Finalment, tot i que molt probablement certes feines desapareixeran, també en sortiran de noves. Per una banda, la IA en si mateixa generarà altres llocs de treball; posar en marxa un sistema d’IA i mantenir-lo requereix moltíssima feina. Per altra banda, si la societat canvia i passa a tenir més temps lliure, també apareixeran noves oportunitats de negoci en el sector dels serveis que generaran nous llocs de treball.
Fins on pot arribar?

Tot i que la Intel·ligència Artificial ha aconseguit coses fins ara impensables, encara està molt lluny de poder crear sistemes realment intel·ligents. El cervell humà és extraordinari i, ni a curt ni a llarg termini, sembla possible que es puguin igualar les seves capacitats amb cap de les tecnologies actuals. Amb les Xarxes Neuronals hem aconseguit que les màquines puguin fer certes tasques tan bé com els humans, però aquestes tasques sempre són molt acotades i no demostren una intel·ligència real. Un exemple que m’encanta és el que donava fa temps Andrej Karpathy en el seu blog, on mostrava la següent imatge i explicava el que requeriria que una màquina pogués entendre-la:

Nosaltres mirem aquesta foto i entenem de seguida el que està passant. Però parem-nos a pensar, per un moment, en el coneixement implícit que necessitaria una màquina per entendre una imatge com aquesta. En primer lloc, el sistema hauria d’entendre tots els elements que surten a la foto (totes les persones, la bàscula, la sala, les taquilles…). Si això fos poc (que no ho és), caldria que el sistema entengués que la persona de sobre la bàscula realment està mesurant el seu pes. A més a més, també hauria d’entendre com funciona la física i adonar-se que l’Obama en realitat està canviant la mesura de la bàscula. Hauria de detectar que la persona de sobre la bàscula està confós sobre el seu pes i que les persones del voltant entenen el que està passant i ho troben divertit. També hauria d’entendre que la situació és graciosa, que el pes personal es fa servir a vegades en forma de broma i que el fet que algú li estigui canviant la mesura sense que ell se n’adoni converteix la situació en divertida. Finalment, per entendre bé la broma, el sistema hauria de reconèixer que qui fa la broma és l’Obama i que el fet que en aquell moment sigui el president dels EUA fa la situació encara més graciosa.

S’han aconseguit grans avenços en els últims anys i, segurament, se n’aconseguiran molts més en els que venen. Però tot i això, els que treballem amb IA sabem que, amb el que tenim ara, probablement no és suficient per crear intel·ligència real. Els models que utilitzem actualment donen bons resultats en tasques molt acotades, però és molt difícil obtenir sistemes robustos quan aquestes tasques són més complexes.

Dit això, hi ha moltíssima gent treballant en IA actualment i potser apareix un mètode nou o un model més bo que aconsegueix el que ara sembla impossible. Els èxits que s’han aconseguit en els últims anys també han despertat un interès major per part de la recerca i, per tant, el camp avança molt de pressa. Actualment els mètodes que tenim no són suficients, però tot pot canviar de la nit al dia.

Més informació

NOTÍCIES RELACIONADES