Cine colectează date mari și de ce?

În toamna lui 2019, a izbucnit un scandal cu serviciul Apple Card: la înregistrare a emis limite de credit diferite pentru bărbați și femei. Chiar și Steve Wozniak nu a avut noroc:

Cu un an mai devreme, a fost dezvăluit că platforma Netflix le arată utilizatorilor diferite postere și teasere, în funcție de sex, vârstă și naționalitate. Pentru aceasta, serviciul a fost acuzat de rasism.

În cele din urmă, Mark Zuckerberg este mustrat în mod regulat pentru că ar fi colectat, vândut și manipulat de către Facebook datele utilizatorilor săi. De-a lungul anilor, a fost acuzat și chiar judecat pentru manipulare în timpul alegerilor americane, ajutând serviciile speciale ruse, instigând la ură și opinii radicale, publicitate nepotrivită, scurgere de date despre utilizatori, obstrucționarea investigațiilor împotriva pedofililor.

Postare pe Facebook de zuck

În același timp, serviciul online Pornhub publică anual rapoarte despre ce fel de porno caută persoane de diferite naționalități, sex și vârstă. Și din anumite motive acest lucru nu deranjează pe nimeni. Deși toate aceste povești sunt similare: în fiecare dintre ele avem de-a face cu date mari, care în secolul XNUMX se numesc „ulei nou”.

Ce este big data

Big data – sunt, de asemenea, big data (ing. Big Data) sau metadate – este o serie de date care sosesc regulat și în volume mari. Acestea sunt colectate, procesate și analizate, rezultând modele și modele clare.

Un exemplu izbitor sunt datele de la Large Hadron Collider, care vine în continuu și în cantități mari. Cu ajutorul lor, oamenii de știință rezolvă multe probleme.

Dar datele mari de pe web nu sunt doar statistici pentru cercetarea științifică. Acestea pot fi folosite pentru a urmări modul în care se comportă utilizatorii de diferite grupuri și naționalități, la ce acordă atenție și modul în care interacționează cu conținutul. Uneori, pentru aceasta, datele sunt colectate nu dintr-o singură sursă, ci din mai multe, comparând și identificând anumite modele.

Despre cât de importantă sunt datele mari în rețea, au început să vorbească atunci când erau foarte multe. La începutul anului 2020, în lume erau 4,5 miliarde de utilizatori de Internet, dintre care 3,8 miliarde erau înregistrați în rețelele sociale.

Cine are acces la Big Data

Potrivit sondajelor, mai mult de jumătate dintre țările noastre consideră că datele lor din rețea sunt folosite de terți. În același timp, mulți postează informații personale, fotografii și chiar un număr de telefon pe rețelele de socializare și aplicații.

Cine colectează date mari și de ce?
Cine colectează date mari și de ce?
Cine colectează date mari și de ce?
Cine colectează date mari și de ce?

Trebuie explicat aici: prima persoană este utilizatorul însuși, care își plasează datele pe orice resursă sau aplicație. În același timp, el este de acord (pune o bifă în acord) cu prelucrarea acestor date a doua parte – adică proprietarii resursei. O terță parte este aceia cărora proprietarii resursei le pot transfera sau vinde datele utilizatorului. Adesea, acest lucru este scris în acordul de utilizare, dar nu întotdeauna.

Terțul este reprezentat de agenții guvernamentale, hackeri sau companii care cumpără date în scopuri comerciale. Primii pot obține date prin decizia unei instanțe sau a unei autorități superioare. Hackerii, desigur, nu folosesc nicio permisiune – pur și simplu pirata bazele de date stocate pe servere. Companiile (prin lege) pot accesa datele numai dacă dvs. le-ați permis - bifând caseta din acord. Altfel, este ilegal.

De ce folosesc companiile Big Data?

Big data în domeniul comercial a fost folosit de zeci de ani, pur și simplu nu a fost atât de intens ca acum. Acestea sunt, de exemplu, înregistrări de la camerele de supraveghere, date de la navigatoarele GPS sau plăți online. Acum, odată cu dezvoltarea rețelelor de socializare, a serviciilor și a aplicațiilor online, toate acestea pot fi conectate și obțineți cea mai completă imagine: unde locuiesc potențialii clienți, ce le place să urmărească, unde merg în vacanță și ce marcă de mașină au.

Din exemplele de mai sus, reiese clar că cu ajutorul datelor mari, companiile, în primul rând, vor să vizeze reclamele. Adică să ofere produse, servicii sau opțiuni individuale doar publicului potrivit și chiar să personalizeze produsul pentru un anumit utilizator. În plus, publicitatea pe Facebook și pe alte platforme mari devine din ce în ce mai scumpă, iar a o arăta tuturor la rând nu este deloc profitabilă.

Informațiile despre potențialii clienți din surse deschise sunt utilizate în mod activ de companiile de asigurări, clinicile private și angajatorii. Primii, de exemplu, pot schimba termenii asigurării dacă văd că deseori cauți informații despre anumite boli sau medicamente, iar angajatorii pot evalua dacă ești predispus la conflicte și comportament antisocial.

Dar există o altă sarcină importantă care s-a luptat în ultimii ani: să se apropie de publicul cel mai solvabil. Acest lucru nu este atât de ușor de realizat, deși sarcina este facilitată semnificativ de serviciile de plată și de verificări electronice printr-un singur OFD (operator de date fiscale). Pentru a se apropia cât mai mult posibil, companiile încearcă chiar să urmărească și să „alimenteze” potențialii clienți încă din copilărie.: prin jocuri online, jucării interactive și servicii educaționale.

Cum functioneaza?

Cele mai mari oportunități de colectare a datelor sunt de la corporațiile globale care dețin mai multe servicii simultan. Facebook are acum peste 2,5 miliarde de utilizatori activi. În același timp, compania deține și alte servicii: Instagram – peste 1 miliard, WhatsApp – peste 2 miliarde și altele.

Dar Google are și mai multă influență: Gmail este folosit de 1,5 miliarde de oameni din lume, alte 2,5 miliarde de sistemul de operare mobil Android, peste 2 miliarde de YouTube. Și asta fără a lua în calcul căutarea Google și aplicațiile Google Maps, magazinul Google Play și browserul Chrome. Rămâne să vă fixați banca online – iar Google va putea ști literalmente totul despre dvs. Apropo, Yandex este deja cu un pas înainte în acest sens, dar acoperă doar publicul vorbitor de limbă rusă.



???? În primul rând, companiile sunt interesate de ceea ce postăm și le place pe rețelele de socializare. De exemplu, dacă banca vede că sunteți căsătorit și vă plac în mod activ fetele pe Instagram sau Tinder, este mai probabil să aprobați un împrumut de consum. Și ipoteca asupra familiei a dispărut.

De asemenea, este important pe ce reclame dați clic, cât de des și cu ce rezultat.

(Ie Următorul pas este mesajele private: acestea conțin mult mai multe informații. S-au scurs mesaje pe VKontakte, Facebook, WhatsApp și alte mesagerie instant. Potrivit acestora, apropo, este ușor să urmăriți geolocalizarea în momentul trimiterii mesajului. Cu siguranță ați observat: atunci când discutați despre cumpărarea ceva sau doar comandarea unei pizza cu cineva, imediat apare publicitatea relevantă în feed.

🚕 Datele mari sunt utilizate în mod activ și „scurgete” de serviciile de livrare și de taxi. Ei știu unde locuiești și lucrezi, ce iubești, care este venitul tău aproximativ. Uber, de exemplu, arată prețul mai mare dacă conduci acasă de la bar și evident exagerat. Și când ai o grămadă de alți agregatori pe telefon, dimpotrivă, ei vor oferi altele mai ieftine.

(Ie Există servicii care folosesc fotografii și videoclipuri pentru a colecta cât mai multe informații. De exemplu, biblioteci de computer vision – Google are una. Ei te scanează pe tine și împrejurimile pentru a vedea ce dimensiune sau înălțime ai, ce mărci purtați, ce mașină conduceți, dacă aveți copii sau animale de companie.

(Ie Cei care oferă băncilor gateway-uri SMS pentru corespondența lor vă pot urmări achizițiile pe card – cunoașterea ultimelor 4 cifre și un număr de telefon – și apoi vinde aceste date altcuiva. De aici tot acest spam cu reduceri și pizza cadou.

🤷️️ În cele din urmă, noi înșine ne scurgem datele către serviciile și aplicațiile din stânga. Amintiți-vă de acel hype în jurul Getcontact, când toată lumea era bucuroasă să-și completeze numărul de telefon pentru a afla cum a fost scris de alții. Și acum găsiți acordul lor și citiți ce scrie despre transferul datelor dvs. (spoiler: proprietarii le pot transfera către terți la discreția lor):

Cine colectează date mari și de ce?

Corporațiile pot colecta și chiar vinde cu succes datele utilizatorilor ani de zile, până când vine vorba de un proces – așa cum sa întâmplat cu același Facebook. Și apoi rolul decisiv l-a jucat încălcarea de către companie a GDPR – o lege din UE care restricționează utilizarea datelor mult mai strict decât cea americană. Un alt exemplu recent este scandalul antivirus Avast: unul dintre serviciile subsidiare ale companiei a colectat și vândut date de la 100 la 400 de milioane de utilizatori.

Dar toate acestea au vreun avantaj pentru noi?

Cât de mari ne ajută pe toți datele?

Da, există și o parte bună.

Big Data ajută la prinderea criminalilor și la prevenirea atacurilor teroriste, la găsirea copiilor dispăruți și la protejarea lor de pericole.

Cu ajutorul lor, noi primim oferte interesante de la bănci și reduceri personale. Datorită lor noi nu plătim pentru multe servicii și rețele sociale care câștigă doar din publicitate. Altfel, numai Instagram ne-ar costa câteva mii de dolari pe lună.

Numai Facebook are 2,4 miliarde de utilizatori activi. În același timp, profitul lor pentru 2019 s-a ridicat la 18,5 miliarde de dolari. Se pare că compania câștigă până la 7,7 USD pe an de la fiecare utilizator prin publicitate.

În sfârșit, uneori este doar convenabil: atunci când serviciile știu deja unde ești și ce vrei și nu trebuie să cauți singur informațiile de care ai nevoie.

Un alt domeniu promițător pentru aplicarea Big Data este educația.

Într-una dintre universitățile americane din Virginia, a fost realizat un studiu pentru a colecta date despre studenții din așa-numitul grup de risc. Aceștia sunt cei care învață prost, pierd cursurile și sunt pe cale să abandoneze școala. Cert este că în state se scad în fiecare an circa 400 de persoane. Acest lucru este rău atât pentru universități, care au ratingurile scăzute și finanțarea redusă, cât și pentru studenții înșiși: mulți iau împrumuturi pentru educație, care, după deducere, vor mai trebui rambursate. Ca să nu mai vorbim de timpul pierdut și de perspectivele de carieră. Cu ajutorul datelor mari, este posibil să identificăm cei care au rămas în urmă în timp și să le oferim un tutore, cursuri suplimentare și alte asistențe specifice.

Acesta, apropo, este potrivit și pentru școli: atunci sistemul va anunța profesorii și părinții – spun ei, copilul are probleme, să-l ajutăm împreună. Big Data vă va ajuta, de asemenea, să înțelegeți ce manuale funcționează mai bine și ce profesori explică mai ușor materialul.

Un alt exemplu pozitiv este profilarea carierei.: acesta este momentul în care adolescenții sunt ajutați să decidă asupra viitoarei lor profesii. Aici, big data vă permite să colectați informații care nu pot fi obținute cu ajutorul testelor tradiționale: cum se comportă utilizatorul, la ce acordă atenție, cum interacționează cu conținutul.

În aceeași SUA există un program de orientare în carieră – SC ACCELERATE. Acesta, printre altele, folosește tehnologia GPS CareerChoice: analizează date despre natura studenților, înclinațiile acestora către subiecte, punctele forte și punctele slabe. Datele sunt apoi folosite pentru a ajuta adolescenții să aleagă colegiile potrivite pentru ei.


Abonați-vă și urmăriți-ne pe Yandex.Zen — tehnologie, inovație, economie, educație și partajare pe un singur canal.

Lasă un comentariu