Datele masive sunt date mai bune, dar ne vor fura locurile de muncă

Mașinile care se conduc singure au fost doar începutul. Cum arată viitorul tehnologiei și proiectării realizate pe baza datelor masive? Într-o captivantă prezentare științifică, Kenneth Cukier se uită la ce urmează în învățarea automată, dar și în cunoașterea umană.

Gândiți-vă de exemplu la problema posturii, cum stați așezați, cum stați dv. sau cum stați dv. sau dv. Diferă în funcție de lungimea piciorului, de spate și de conturul spatelui. Dacă aș pune sensori, să zicem 100 de sensori, în scaunele tuturor, aș putea crea un index unic pentru fiecare. Ca o amprentă, dar nu a degetului.

Și la ce am putea s-o folosim? Unii cercetători din Tokio o folosesc ca posibil sistem antifurt pentru mașini. Ideea e că hoțul stă la volan, încearcă să pornească, dar mașina recunoaște că la volan e un șofer neautorizat și atunci de exemplu se oprește motorul dacă nu tastezi o parolă în sistem ca să-i spui: „Hei, sunt autorizat să conduc.” Grozav.

Ce-ar fi dacă toate mașinile din Europa ar folosi această tehnologie? Ce am putea face atunci? Dacă punem datele cap la cap poate reușim să identificăm semnele distinctive care să prezică optim că se va produce un accident de mașină în următoarele cinci secunde. Astfel s-ar datifica oboseala șoferului. Iar utilitatea apare când mașina simte că persoana cade în poziția aceea și știe automat să pornească o alarmă internă, să vibreze volanul sau să claxoneze înăuntru, să spună: „Trezește-te, fii mai atent la drum!” Astfel de lucruri putem face datificând mai multe aspecte ale vieții.

 

Deci ce valoare au datele masive? Ia gândiți-vă. Avem mai multe informații. Putem face lucruri pe care nu le puteam face înainte. Una din aplicațiile impresionante ale acestei noțiuni e în domeniul învățării automate. Învățarea automată e o ramură a inteligenței artificiale care ea însăși e o ramură a informaticii. Pe scurt, în loc să instruim un calculator ce să facă, bombardăm problema cu informații și-i cerem calculatorului să descopere singur. Veți înțelege mai bine dacă veți vedea începuturile. În anii 1950, un informatician de la IBM pe nume Arthur Samuel, căruia îi plăcea să joace dame, a scris un program pentru a putea juca împotriva calculatorului. A jucat. A câștigat. A jucat. A câștigat. A jucat. A câștigat. Pentru că tot ce știa calculatorul erau mutările permise. Arthur Samuel mai știa altceva. Arthur Samuel mai știa și strategie. Atunci a adăugat un mic sub-program care să opereze în fundal. Tot ce făcea era să calculeze probabilitatea ca o configurație dată să conducă la o tablă de joc câștigătoare sau necâștigătoare după fiecare mutare. Joacă cu calculatorul. Câștigă. Joacă cu calculatorul. Câștigă. Joacă cu calculatorul. Câștigă. Atunci Arthur Samuel lasă calculatorul să joace singur. Joacă singur, adună mai multe date. Adună mai multe date, îi crește precizia predicției. Atunci Arthur Samuel se întoarce la calculator și joacă cu el, și pierde. Și joacă, și pierde. Și joacă, și pierde. Și Arthur Samuel a creat o mașină care îl depășește la o sarcină în care el a inițiat-o.

Această idee de învățare automată se răspândește peste tot. Cum credeți că avem mașini care se conduc singure? E societatea mai capabilă să pună toate regulile rutiere într-un software? Nu. E mai ieftină memoria? Nu. Sunt mai rapizi algoritmii? Nu. Sunt mai bune procesoarele? Nu. Toate astea contează, dar nu sunt ele motivul. Motivul e că am schimbat natura problemei. Am trecut de la a-i spune deschis și explicit calculatorului cum să conducă la a-i spune: „Iată o mulțime de date despre vehicul. Descurcă-te. Prinde-te singur că ăla e un semafor, că semaforul e roșu și nu verde, că asta înseamnă să te oprești și nu să continui”.

 Învățarea automată e la baza multor lucruri pe care le facem online: motoare de căutare, algoritmul de personalizare de la Amazon, traduceri computerizate, sisteme de recunoaștere a vocii. Cercetătorii s-au interesat recent de problema biopsiilor, a biopsiilor de cancer. Au cerut calculatorului să identifice, analizând datele și procentajul de supraviețuire, să determine dacă într-adevăr celulele sunt canceroase sau nu. Și bineînțeles, folosind date și un algoritm de învățare automată, mașina a reușit să identifice cele 12 semne tipice care prezic optim că biopsia unor celule canceroase de sân e într-adevăr canceroasă. Problema? Literatura medicală cunoștea numai nouă dintre ele. Trei caracteristici nu erau între cele care trebuiau verificate, dar mașina le-a detectat.

Datele masive au și părți negative. Ne vor îmbunătăți viața, dar sunt probleme de care trebuie să fim conștienți. Prima e ideea că s-ar putea să fim pedepsiți pentru predicții, că poliția ar putea folosi datele masive pentru propriile scopuri, ca în filmul „Raport Special”. Se numește „poliție preventivă” sau „criminologie algoritmică”, iar ideea e că folosind multe date, de exemplu locul crimelor trecute, știm unde să trimitem patrulele. Are logică, dar desigur problema e că nu se va limita la localizare, ci va ajunge la nivelul individului. De ce să nu folosim date din foaia matricolă de liceu? Poate ar trebui să ținem cont dacă sunt șomeri, ce risc de credit au, ce comportament au pe internet, dacă se culcă noaptea târziu. Fitbitul lor, când va decela biochimia, va arăta că au gânduri agresive. Poate vom avea algoritmi care să prezică ce avem de gând să facem și poate vom fi trași la răspundere înainte de a face ceva. Intimitatea era problema centrală în epoca datelor puține. În epoca datelor masive problema va fi de a proteja liberul arbitru, alegerea morală, voința umană, factorul uman.

Mai e o problemă. Datele masive ne vor fura locurile de muncă. Datele masive și algoritmii vor pune la încercare munca funcționarilor și a profesioniștilor în secolul XXI așa cum automatizarea fabricilor și linia de asamblare au pus la încercare muncitorimea în secolul XX. Să luăm un laborant care se uită cu microscopul la o biopsie de cancer să vadă dacă e canceroasă sau nu. Omul a fost la facultate. Cumpără proprietate. Votează. E acționar în societate. Omul acesta și o întreagă armată de profesioniști ca el își vor găsi slujbele schimbate radical sau chiar complet eliminate. Ne place să credem că tehnologia creează slujbe pentru o vreme după o perioadă scurtă de dislocare. E adevărat în sistemul de referință cu care trăim: revoluția industrială. Pentru că exact așa s-a întâmplat. Dar uităm ceva în analiza aceasta: anumite categorii de locuri de muncă sunt eliminate total și nu se mai întorc. Revoluția industrială nu prea a fost bună dacă erai un cal. Deci va trebui să avem grijă, să luăm datele masive și să le adaptăm la nevoile noastre, la nevoile noastre foarte omenești. Trebuie să fim stăpânul tehnologiei, nu servitorul ei. Era datelor masive abia acum începe și, sincer, nu prea ne descurcăm cu datele pe care le putem colecta acum. Nu e doar o problemă pentru Agenția de Securitate Națională. Firmele adună o mulțime de date și mai abuzează de ele. Trebuie să avansăm, iar asta durează. E cam ca problema pe care o avea omul primitiv cu focul. E o unealtă, dar e o unealtă care, dacă nu suntem atenți, ne va arde.

Datele masive ne vor transforma viața, munca și gândirea. Ne vor ajuta să ne ocupăm de cariere și să trăim o viață plină de satisfacții, de speranță, de fericire și de sănătate. Dar în trecut ne-am uitat adesea la tehnologia informației și ochii noștri au văzut doar T-ul, tehnologia, hardware-ul, pentru că asta era partea fizică. Acum trebuie să ne aruncăm privirea pe I, informația, care e mai puțin vizibilă, dar în unele privințe mult mai importantă. Omenirea poate în sfârșit învăța din informațiile pe care le poate colecta, în încercarea noastră dintotdeauna de a înțelege lumea și locul nostru în ea. De aceea datele masive sunt mare scofală.