Het ziet er naar uit dat AOL (America Online, één van de eerste ISP’s in de VS, nu Time Warner) vandaag de grootste blunder ooit heeft begaan wat zoekmachines en privacy betreft.

Andrew Weinstein, een woordvoerder van AOL, vertelt in de comments (inclusief verontschuldigingen) van de plentyoffisch blog wat er precies vrijgegeven werd door AOL:

  • Zoekdata van 658.000 anonieme gebruikers over een periode van 3 maanden (maart tot mei).
  • Geen persoonlijk identificeerbare data, maar wel zoekstrings die persoonlijke data kunnen bevatten.
  • De data zou maar 1.5% van de zoekacties op AOL in mei bevatten en zich beperken tot opzoekingen gedaan met de AOL client software in de VS.

De data werd ondertussen offline gehaald (Techcrunch), maar op deze mirror kunnen de bestanden verder gedownload worden. Een eerste voorbeeld analyse (opgepast, dit is een interpretatie van de data door 1 persoon) is alvast opmerkelijk: ‘wil iemand zijn vrouw vermoorden?’ of ‘groeit MySpace vooral via SEO Spam?’. Verder geeft de data ook de belangrijkste keywoorden vrij die leiden naar een website (ideaal voor spammers en keywoord gerelateerde diensten zoals Adsense).

Jason Calcanis (blogger, medeoprichter van het blognetwerk Weblogs Inc, vandaag ook Time Warner) komt zelf met de ultieme oplossing: geen logs meer bijhouden.

De fout is begaan en de data is beschikbaar op het net. De gevolgen voor de privacy van de getroffen gebruikers en de waarde van de data zijn vandaag nauwelijks in te schatten. En dan moeten we bedenken dat de hoeveelheid data die nu vrijgegeven is (in vergelijking met wat Googles, MSN of Yahoo wereldwijd loggen) maar een fractie uitmaakt van de data die beschikbaar is bij de Googles van deze wereld.

Ik wil niet denken aan die file waar alles instaat wat ik ooit zocht, of mijn lief, of mijn vrienden, mijn studenten of mijn ouders. Is big brother dan toch dichterbij dan ik dacht. Of wil denken? Hallucinant gewoon. Brrr…

Meer leesvoer: Marketingfacts, serach log forum

[tags]AOL, America Online, search logs, gebruikersdata, Big brother[/tags]

12 Responses to “AOL: de grootste search en privacy blunder ooit”

  1. LVB

    “De gevolgen voor de privacy van de getroffen gebruikers”.

    En wie zijn die gebruikers? Niemand die het weet, niemand die het kan weten. Ze kunnen dus ook niet ‘getroffen’ zijn.

    Ik lees geen argumenten waarom dit een ‘fout’ of een ‘blunder’ zou zijn.

    En ik ben er vrij zeker van dat de hele zaak volgens de Belgische privacywetgeving in orde zou zijn. Met de vrijgegeven informatie kan niet achterhaald worden *wie* er wat opzocht.

  2. Huug

    Ik lees in de krant:
    ,,Het grootste probleem is dat veel mensen wel eens hun eigen naam ingeven, of die van vrienden en familie. (…) Combineer dat met pornografische zoekopdrachten en je wordt ernstig in verlegenheid gebracht. (…) Combineer het met een adres of een socialezekerheidsnummer, en je hebt een nakende identiteitsdiefstal.”

  3. LVB

    @Huug: En andere mensen, volslagen onbekenden zelfs, geven wel eens mijn naam in. Bewijst dus niks.

    Ook het voorbeeld van de zoekopdracht naar “hoe vermoord ik mijn vrouw” bewijst niks. Het kan een auteur zijn die opzoekingswerk deed voor een roman. Het kan nog om honderden andere mogelijke scenario’s gaan.

    Privacy betekent ook: je niet bemoeien met andermans motieven. Nu blijkt dat de mensen die het hardst roepen “privacy geschonden!” de eersten zijn om te beweren dat ze de gedachten en motieven van anderen kunnen raden aan de hand van enkele zoekopdrachten.

  4. LVB

    Opzoeking van een adres: waarom zou ik mijn eigen adres opzoeken? Integendeel, ik vond hier een verloren voorwerp en daar stond een adres op, en ik wou weten welke naam daar bij hoorde.

    Opzoeking van een social security number: waarom zou ik mijn eigen nummer opzoeken? Integendeel, ik vond hier een document met alleen maar een SS-number op, en ik wou opzoeken wie de eigenaar was.

    Ik maak me eigenlijk meer zorgen om al die mensen die aan de hand van een paar wazige details al meteen verregaande conclusies trekken, dan om het vrijgeven van die zoekopdrachten.

  5. Huug

    Welja, zat ik me achteraf ook te bedenken: ik geef eigenlijk ook nooit mijn naam in als ik naar zware, ranzige snufmovies, gangbangparties en porno zit te zoeken (uiteraard allemaal opzoekingwerk voor een boek dat ik daarover ga schrijven) so, what’s the point?

    “Ik maak me eigenlijk meer zorgen om al die mensen die aan de hand van een paar wazige details al meteen verregaande conclusies trekken, dan om het vrijgeven van die zoekopdrachten.”
    Precies, U heeft een punt. Ik kan me ook mateloos ergeren aan mensen die denken dat ze in mijn plaats moeten denken.

  6. Clopin.be: Past is prologue » AOL Search logs

    [...] Je weet misschien ondertussen dat AOL zowat de grootste vergissing in zijn of haar bestaan heeft gemaakt: ze hebben search logs vrijgegeven. Zie Smetty bijvoorbeeld. Uiteraard zijn de logs verdwenen, maar u kent het net: niets verdwijnt. Via deze interface (ook in de linkblog) zijn er dan ook leuke dingen te doen! Google Blogoscoped heeft er al een aantal op een rijtje gezet. Mocht u zich trouwens afvragen of iemand geïnteresseerd is in die spammails die ook in jou mailbox zitten, try contest number 3177924! [...]

  7. Smetty

    De eerste persoon is officieel erkend door de New York Times (09/09/2006):

    “Buried in a list of 20 million Web search queries collected by AOL and recently released on the Internet is user No. 4417749. The number was assigned by the company to protect the searcher’s anonymity, but it was not much of a shield…

    It did not take much investigating to follow that data trail to Thelma Arnold, a 62-year-old widow who lives in Lilburn, Ga…”

  8. Clopin

    Nog steeds geen fout?
    Nice find Smetty.

  9. Mike

    ‘k weet dat het een flauwe opmerking is, maar… De New York Times zullen die persoon pas binnen een maand identificeren, blijkbaar.

  10. Smetty

    Flauw :-)

  11. anendel

    Doet me in lichte mate denken aan de film ‘Minority Report’, film uit 2002 die toch weer iets realistischer lijkt. Zouden overheidsinstanties conclusies trekken en acties ondernemen puur uit de zoekopdrachten van een individu? Dagdagelijks alle mogelijk informatie over terrorisme, bommen en weet ik veel wat opzoeken om dan op een dag door de CIA of special forces uit uw bed te worden gelicht… Werkelijkheid of het plot voor een ongeloofwaardige B-movie?

  12. ty

    A site where you can search this data is here:

    http://www.datablunder.com/logitems/query/

U zegt of denkt?



Om te controleren of u geen machine bent die mijn comments spamt, dient u eerst in de captcha module onderaan de 2 woorden die u ziet over te typen alvorens de comment te versturen (submit comment).

Proudly powered by WordPress. Theme developed with WordPress Theme Generator.
Creative Commons License

Creative Commons License Creative Commons License