CHANGE.WORLD: Ochiul robotului

Articolul de astăzi al rubricii noastre are ca subiect capabilitățile vizuale ale mașinilor automate. Am fost martori în ultimii ani ai unor progrese spectaculoase ale roboticii, care se grupau în două categorii: un salt calitativ enorm în capacitatea de calcul (ceea ce în termeni umani numim ‘raționament’ sau ‘gândire’, amplificate de Inteligența Artificială – IA) și funcționalitatea mecanică (roboți care merg sau aleargă, senzorialitate tactilă). Mai puțin s-a scris și vorbit despre capabilitățile vizuale (‘computer vision’). Acestea se află, conform unor realizări anunțate în ultimele luni, în pragul unor progrese spectaculoase, iar modelul care le-a inspirat nu este altul decât unul dintre cele mai perfecționate sisteme din corpul omenesc: sistemul vizual, cu ochii și legăturile lor cu creierul.

Robotic hands on steering wheel while driving autonomous car. 3D illustration.

(sursa imaginii: autonomousvehicleinternational.com/features/is-camera-only-the-future-of-self-driving-cars.html)

Pentru a înțelege importanța acestor descoperiri, să analizăm una dintre aplicațiile cele mai sofisticate ale roboticii – șoferii autonomi. Aceste sisteme folosesc între 8 camere video exterioare + una interioară (Tesla FSD) și 29 de camere (Waymo Driver). Ele se adaugă unui număr de alte sisteme lidar, radar și senzori de diferite alte tipuri, ce transmit informațiile sistemului de auto-pilotare, care le traduce, interpretează, integrează și ia deciziile optime în timp real. Aceste procese sunt însă foarte complexe. Interpretarea informației vizuale, de exemplu, pentru un șofer experimentat, include experiențe trecute care îi permit să identifice pericole cum sunt schimbarea culorii unui semafor, apariția unui animal pe șosea, pietoni indisciplinați care traversează unde și când nu este permis sau schimbări de bandă fără semnalizare ale mașinilor conduse de șoferi imprudenți, și să le filtreze, eliminând alte schimbări în peisajul vizual care nu reprezintă pericole. Sistemele moderne care integrează informația de la camerele video folosesc algoritmi bazați pe fluxul optic, un fenomen descoperit în anii ’50 ai secolului trecut, de psihologul american James J. Gibson. Acest tip de algoritmi este capabil să detecteze mișcarea direct din analiza vectorilor luminoși, în loc de compararea intensivă a unor imagini statice, la fel cum o face sistemul nervos uman, fără participarea unității centrale (creier). Metodele bazate pe flux optic solicită resurse de calcul considerabile și impactează viteza de reacție. Întârzierea poate fi până la 0,5-0,6 secunde. În condiții de trafic la o viteză de 80 km/h, această întârziere poate duce la o distanță de frânare de peste 12 metri, cea ce poate fi exact distanța dintre un accident fatal și evitarea acestuia.

(sursa imaginii: researchgate.net/figure/sual-pathways-from-the-retina-through-the-lateral-geniculate-nucleus-LGN-of-the_fig1_251463255)

Descoperirea anunțată aparține unei echipe de cercetători chinezi în robotică, aflată sub conducerea profesorului Shuo Gao, doctor în inginerie electrică la Universitatea din Cambridge, Marea Britanie, în prezent profesor asociat la Universitatea Beihang din Beijing, China. Inspirația le-a venit tot din studiul sistemului vizual uman, care are capacitatea de a concentra atenția doar acolo unde este nevoie. Esentială în acest proces este o regiune a creierului cunoscută sub numele de nucleul geniculat lateral (LGN). Geniculat înseamnă în anatomie îndoit ca un genunchi. LGN acționează ca o stație de releu în traseul vizual, primind informații de la retină – unde stimulii vizuali sunt convertiți în semnale electrice – și transmițându-le cortexului vizual al creierului, unde aceste semnale sunt procesate. Dar LGN joacă și un rol important de filtrare, indicând cortexului vizual unde ar trebui prioritizată puterea de procesare. Deoarece filtrul LGN este sensibil atât la schimbările de timp, cât și la cele de spațiu, acesta permite creierului să identifice și să urmărească eficient mișcarea rapidă, fie că este vorba despre un semafor care se schimbă, fie despre un pieton care traversează strada. Profesorul Gao și echipa sa au introdus un strat asemănător LGN în sistemele de vedere artificială pentru a ghida atenția algoritmilor de flux optic. Schimbarea aceasta de arhitectură nu ar fi însă suficientă, și roboticienii chinezi au propus și o implementare hardware diferită. Cipurile cu circuite care procesează informațiile separat de cele care stochează date nu ar fi oferit accelerarea de care aveau nevoie. Cercetătorii chinezi propun folosirea unui tip de hardware numit neuromorfic, care imită creierul uman prin integrarea funcțiilor de procesare și stocare în același circuit.

(sursa imaginii: https://recfaces.com/articles/computer-vision-vs-machine-vision)

Cercetătorii au implementat deocamdată un prototip, care este capabil să detecteze schimbările de luminozitate din fluxul optic și să le transforme pe acestea, prin intermediul blocului LGN, în informații de fluxuri optice prioritizate, folosind rețele sinaptice bazate pe hardware neuromorfic. Rezultatele indică o îmbunătățire spectaculoasă (de patru ori) a vitezei de reacție, păstrând sau îmbunătățind rezoluția imaginilor. Testarea s-a făcut atât pe roboți cu brațe mecanice, cât și pe șoferi autonomi. Până la implementarea pe scară largă mai sunt de parcurs câteva etape. Prototipurile trebuie transformate în produse industriale viabile tehnologic și economic. Trebuie luat în considerare faptul că a fost rezolvată o problemă (cea a priorității informației vizuale), însă rămân aceleași limitări ale unității centrale, care ia decizii privind acțiunile. Perspectivele sunt însă spectaculoase. Ochii electronici ai roboților vor avea aceeași inteligență încorporată în sistemul de decizii al sistemului vizual uman, dar posibilități fizice superioare (viziune 360 de grade, rezoluție mult mai precisă). Aplicațiile pot fi multiple – de la vehicule autonome și roboți industriali sau casnici, până la implanturi în corpul omenesc care pot rezolva boli până acum nevindecabile și recupera sau dărui vederea unor pacienți considerați iremediabil orbi. Poate că această perspectivă îi înfricoșează pe mulți, dar cunoașterea fiziologiei și anatomiei umane avansează în paralel și se influențează reciproc cu progresele roboticii. Să încercăm să înțelegem și să folosim spre bine aceste progrese științifice și tehnologice multi-disciplinare.

Articolul a fost publicat inițial în revista de cultură ‘Literatura de Azi’

This entry was posted in change.world. Bookmark the permalink.

CHANGE.WORLD: Ochiul robotului

(sursa imaginii: researchgate.net/figure/sual-pathways-from-the-retina-through-the-lateral-geniculate-nucleus-LGN-of-the_fig1_251463255)

(sursa imaginii: https://recfaces.com/articles/computer-vision-vs-machine-vision)

Leave a Reply Cancel reply

Categories

Archives

Recent Comments

Recent Posts

Recent Comments

Archives

Categories

Meta