AOL: de grootste search en privacy blunder ooit

Het ziet er naar uit dat AOL (America Online, één van de eerste ISP’s in de VS, nu Time Warner) vandaag de grootste blunder ooit heeft begaan wat zoekmachines en privacy betreft.

Andrew Weinstein, een woordvoerder van AOL, vertelt in de comments (inclusief verontschuldigingen) van de plentyoffisch blog wat er precies vrijgegeven werd door AOL:

  • Zoekdata van 658.000 anonieme gebruikers over een periode van 3 maanden (maart tot mei).
  • Geen persoonlijk identificeerbare data, maar wel zoekstrings die persoonlijke data kunnen bevatten.
  • De data zou maar 1.5% van de zoekacties op AOL in mei bevatten en zich beperken tot opzoekingen gedaan met de AOL client software in de VS.

De data werd ondertussen offline gehaald (Techcrunch), maar op deze mirror kunnen de bestanden verder gedownload worden. Een eerste voorbeeld analyse (opgepast, dit is een interpretatie van de data door 1 persoon) is alvast opmerkelijk: ‘wil iemand zijn vrouw vermoorden?’ of ‘groeit MySpace vooral via SEO Spam?’. Verder geeft de data ook de belangrijkste keywoorden vrij die leiden naar een website (ideaal voor spammers en keywoord gerelateerde diensten zoals Adsense).

Jason Calcanis (blogger, medeoprichter van het blognetwerk Weblogs Inc, vandaag ook Time Warner) komt zelf met de ultieme oplossing: geen logs meer bijhouden.

De fout is begaan en de data is beschikbaar op het net. De gevolgen voor de privacy van de getroffen gebruikers en de waarde van de data zijn vandaag nauwelijks in te schatten. En dan moeten we bedenken dat de hoeveelheid data die nu vrijgegeven is (in vergelijking met wat Googles, MSN of Yahoo wereldwijd loggen) maar een fractie uitmaakt van de data die beschikbaar is bij de Googles van deze wereld.

Ik wil niet denken aan die file waar alles instaat wat ik ooit zocht, of mijn lief, of mijn vrienden, mijn studenten of mijn ouders. Is big brother dan toch dichterbij dan ik dacht. Of wil denken? Hallucinant gewoon. Brrr…

Meer leesvoer: Marketingfacts, serach log forum

[tags]AOL, America Online, search logs, gebruikersdata, Big brother[/tags]

U zegt?
  1. LVB says:

    “De gevolgen voor de privacy van de getroffen gebruikers”.

    En wie zijn die gebruikers? Niemand die het weet, niemand die het kan weten. Ze kunnen dus ook niet ‘getroffen’ zijn.

    Ik lees geen argumenten waarom dit een ‘fout’ of een ‘blunder’ zou zijn.

    En ik ben er vrij zeker van dat de hele zaak volgens de Belgische privacywetgeving in orde zou zijn. Met de vrijgegeven informatie kan niet achterhaald worden *wie* er wat opzocht.

  2. Huug says:

    Ik lees in de krant:
    ,,Het grootste probleem is dat veel mensen wel eens hun eigen naam ingeven, of die van vrienden en familie. (…) Combineer dat met pornografische zoekopdrachten en je wordt ernstig in verlegenheid gebracht. (…) Combineer het met een adres of een socialezekerheidsnummer, en je hebt een nakende identiteitsdiefstal.”

  3. LVB says:

    @Huug: En andere mensen, volslagen onbekenden zelfs, geven wel eens mijn naam in. Bewijst dus niks.

    Ook het voorbeeld van de zoekopdracht naar “hoe vermoord ik mijn vrouw” bewijst niks. Het kan een auteur zijn die opzoekingswerk deed voor een roman. Het kan nog om honderden andere mogelijke scenario’s gaan.

    Privacy betekent ook: je niet bemoeien met andermans motieven. Nu blijkt dat de mensen die het hardst roepen “privacy geschonden!” de eersten zijn om te beweren dat ze de gedachten en motieven van anderen kunnen raden aan de hand van enkele zoekopdrachten.

  4. LVB says:

    Opzoeking van een adres: waarom zou ik mijn eigen adres opzoeken? Integendeel, ik vond hier een verloren voorwerp en daar stond een adres op, en ik wou weten welke naam daar bij hoorde.

    Opzoeking van een social security number: waarom zou ik mijn eigen nummer opzoeken? Integendeel, ik vond hier een document met alleen maar een SS-number op, en ik wou opzoeken wie de eigenaar was.

    Ik maak me eigenlijk meer zorgen om al die mensen die aan de hand van een paar wazige details al meteen verregaande conclusies trekken, dan om het vrijgeven van die zoekopdrachten.

  5. Huug says:

    Welja, zat ik me achteraf ook te bedenken: ik geef eigenlijk ook nooit mijn naam in als ik naar zware, ranzige snufmovies, gangbangparties en porno zit te zoeken (uiteraard allemaal opzoekingwerk voor een boek dat ik daarover ga schrijven) so, what’s the point?

    “Ik maak me eigenlijk meer zorgen om al die mensen die aan de hand van een paar wazige details al meteen verregaande conclusies trekken, dan om het vrijgeven van die zoekopdrachten.”
    Precies, U heeft een punt. Ik kan me ook mateloos ergeren aan mensen die denken dat ze in mijn plaats moeten denken.

  6. Smetty says:

    De eerste persoon is officieel erkend door de New York Times (09/09/2006):

    “Buried in a list of 20 million Web search queries collected by AOL and recently released on the Internet is user No. 4417749. The number was assigned by the company to protect the searcher’s anonymity, but it was not much of a shield…

    It did not take much investigating to follow that data trail to Thelma Arnold, a 62-year-old widow who lives in Lilburn, Ga…”

  7. Clopin says:

    Nog steeds geen fout?
    Nice find Smetty.

  8. Mike says:

    ‘k weet dat het een flauwe opmerking is, maar… De New York Times zullen die persoon pas binnen een maand identificeren, blijkbaar.

  9. Smetty says:

    Flauw 🙂

  10. anendel says:

    Doet me in lichte mate denken aan de film ‘Minority Report’, film uit 2002 die toch weer iets realistischer lijkt. Zouden overheidsinstanties conclusies trekken en acties ondernemen puur uit de zoekopdrachten van een individu? Dagdagelijks alle mogelijk informatie over terrorisme, bommen en weet ik veel wat opzoeken om dan op een dag door de CIA of special forces uit uw bed te worden gelicht… Werkelijkheid of het plot voor een ongeloofwaardige B-movie?

  11. ty says:

    A site where you can search this data is here:

    http://www.datablunder.com/logitems/query/

Trackbacks for this post

  1. Clopin.be: Past is prologue » AOL Search logs