Cine sunt cei care ne ascultă discuţiile prin smartphone-uri. Sunt plătiţi cu 12 dolari pe oră şi notează fiecare cuvânt pe laptopurile lor

Ziarul Financiar 27.02.2021

Alexa, Siri, Cortana sunt câteva dintre numele care ştiu poate mai multe despre noi decât cei mai apropiaţi prieteni ai noştri. Cum au ajuns giganţii din Silicon Valley să ne cunoască cele mai ascunse secrete?

Lui Ruthy Hope Slatis nu-i venea să creadă ceea ce auzea. Era angajată temporar printr-o agenţie de recrutare din afara Bostonului pentru un post cu o descriere vagă: transcrierea de fişiere audio pentru Amazon.com. Pentru 12 dolari pe oră, ea şi colegii săi aduşi prin contract sau „asociaţi de date” ascultau fragmente de conversaţii aleatorii şi notau fiecare cuvânt pe laptopurile lor. Amazon ar spune că munca a fost esenţială pentru un produs top secret de recunoaştere a vorbirii. Fişierele includeau înregistrări cu momentele cele mai intime din casele oamenilor, scrie Bloomberg.

Acestea se întâmplau în toamna anului 2014, când Amazon a dezvăluit boxa portabilă Echo animată de asistentul virtual activat prin voce Alexa. Amazon spune despre Alexa că este un miracol al inteligenţei artificiale în prima sa reclamă pentru Echo – în clip o familie solicita şi primea actualizări de ştiri, răspunsuri la întrebări banale şi ajutor la temele copiilor. Însă Slatis a început curând să înţeleagă măsura în care oamenii se aflau în spatele magiei robotice pe care o vedea în reclamă. „O, Dumnezeule, la asta lucrez”, îşi aminteşte ea ce gândea atunci.

Amazon surprindea fiecare comandă vocală din cloud şi se baza pe analişti de date ca ea pentru a învăţa sistemul. Slatis credea la început că asculta testeri plătiţi care şi-au oferit modelele vocale în schimbul câtorva dolari. Şi-a dat seama că nu este deloc aşa.

Înregistrările pe care le asculta împreună cu colegii ei erau deseori intense, ciudate sau foarte ciudate. Oameni ce păreau singuri îşi mărturiseau secretele şi temerile intime: un băiat şi-a exprimat dorinţa de a viola; erau bărbaţi care o tratau pe Alexa ca Joaquin Phoenix în filmul SF „Her”. Şi cum programul de transcriere a crescut odată cu popularitatea Alexei, la fel creşteau şi informaţiile private dezvăluite în înregistrări. Alţi asociaţi de date îşi amintesc de copii care îşi împărtăşeau adresa de domiciliu şi numărul de telefon, de un bărbat care încerca să comande jucării sexuale, de un invitat la o petrecere care se întreba cu voce tare dacă nu cumva Amazon se uita la ei chiar în acel moment.

„N-aveau cum să fi ştiut că sunt ascultaţi”, spune Slatis. „Aceşti oameni nu au fost de acord cu acest lucru.” Ea a renunţat în 2016. La cinci ani de când Slatis a simţit pentru prima că i se face pielea de găină, un sfert dintre americani au „boxe inteligente” precum Echo, Google Home şi Apple HomePod. (Sunt câţiva care au cumpărat chiar şi Portalul Facebook, un ecran video inteligent.) Amazon câştigă până acum bătălia vânzărilor, raportând că au fost achiziţionate peste 100 de milioane de dispozitive animate de Alexa

Însă acum, între cele mai mari companii din lume se duce un război pentru a o aduce pe Alexa, pe Siri al Apple, pe asistentul Google, pe Cortana a Microsoft şi pe serviciul echivalent al Facebook mult mai adânc în vieţile oamenilor. Microfoanele sunt încorporate în telefoane, ceasuri inteligente, televizoare, frigidere, SUV-uri şi mai tot ce înseamnă dispozitiv inteligent. Firma de consultanţă Juniper Research estimează că până în 2023 piaţa mondială a boxelor inteligente va ajunge la 11 miliarde de dolari pe an şi că vor exista aproximativ

7,4 miliarde de dispozitive controlate prin voce. Este vorba despre un dispozitiv pentru fiecare persoană de pe Pământ.
Aceste maşini nu creează fişiere audio din fiecare decibel al tău – companiile tehnologice spun că difuzoarele lor inteligente înregistrează audio doar atunci când utilizatorii le activează, dar introduc microfoane active în permanenţă în bucătării şi dormitoare care ar putea să surprindă sunete pe care utilizatorii nu intenţionează să le împartă cu nimeni. „Microfoanele care ascultă tot timpul sunt ceva îngrijorător.

Am descoperit că utilizatorii acestor dispozitive închid ochii şi au încredere că companiile nu vor face nimic rău cu datele înregistrate ”, spune Florian Schaub, profesor de la Universitatea din Michigan, care studiază comportamentul uman în jurul software-ului de comandă vocală. „Există această eroziune înfiorătoare a vieţii private care continuă fără întrerupere. Oamenii nu ştiu să se protejeze.”

Cu toate acestea, aşa-numitele dispozitive inteligente depind de mii de oameni slab plătiţi care strâng fragmente de sunet cu ajutorul cărora companiile de tehnologice îşi îmbunătăţesc urechile electronice; şoaptele noastre cele mai uşoare au devenit unele dintre cele mai valoroase seturi de date ale giganţilor din Silicon Valley. La începutul acestui an, Bloomberg News a scris în premieră despre amploarea utilizării de către industria de tehnologie a oamenilor pentru a asculta sunetele colectate de la utilizatorii lor fără permisiune.Actuali şi foşti asociaţi de date ca Slatis arată clar că dezavantajele supravegherii audio generale erau evidente pentru cei cu mize financiare mai mici în joc. „Nu s-a simţit niciodată ca fiind ceva corect”, spune un transcriptor pentru un rival al Alexa, care, la fel ca majoritatea asociaţilor de date, a semnat un acord care-i interzice să vorbească despre munca sa. „Ce vând ei cu adevărat clienţilor?”

Pentru procesul de învăţare a maşinilor să identifice şi să răspundă la propoziţii vorbite a fost de cele mai multe ori nevoie de potrivirea fişierelor audio cu textul transcris. Este un proces lent şi scump. Primii pionieri au cumpărat sau au construit biblioteci masive de înregistrări – oameni care citesc ziare sau alte materiale pre-scrise la microfon. Apple a devenit prima companie majoră care a schimbat modelul când în 2011 a livrat iPhone 4S cu Siri, achiziţionat cu un an înainte de la un centru de cercetare finanţat de Pentagon. 

Nu mai era nevoie ca înregistrările să fie scrise şi potrivite în laboratoare. Apple a vândut peste 4 milioane de telefoane 4S în câteva zile şi în curând a început să acumuleze un munte de date vocale gratuite şi naturale. În primii ani, compania a avut încredere în specialiştii în software vocal pentru a utiliza datele cu scopul de a îmbunătăţi abilităţile lui Siri, însă Apple a revenit la control în jurul anului 2014. „Munca era foarte migăloasă: după ce ascultai 15 sau 30 de minute, căpătai dureri de cap”, spune Tao Ma, fost specialist de vorbire la Siri. Echipa de la Apple a cedat o mare parte a acestei munci firmelor de outsourcing din Europa, inclusiv GlobeTech, din Irlanda.

În ultimii ani, Apple a devenit mai agresivă în procesul de culegere şi analiză a vocilor oamenilor, fiind îngrijorată de faptul că puterea de a înţelege şi viteza lui Siri au rămas în urma celor ale Alexa şi Google Assistant. Apple a tratat dezvoltarea lui Siri ca pe un motor de căutare verbală pe care trebuia să-l pregătească pentru a răspunde întrebărilor interminabile ale utilizatorilor şi şi-a crescut dependenţa de analiza audio pentru a alimenta lexiconul asistentului.

CITITI AICI MATERIALUL INTEGRAL