“Hello, fellow human”

Heb je ook al gemerkt dat er tegenwoordig verschillende manieren zijn voor een website om na te gaan of je wel degelijk een ‘mens’ bent en geen bot? Dat heet een CAPTCHA (of reCAPTCHA ondertussen) Vroeger kreeg  je twee woorden voorgeschoteld die je correct moest overtypen om verder te gaan. Eentje was een vervormde versie van een woord en de andere een foto van een woord in een boek.  Je hebt het nooit geweten, maar dat woord uit dat boek moest eigenlijk niet juist getypt worden…

Google, het bedrijf achter reCAPTCHA, heeft je gewoon gebruikt om haar reusachtige backlog aan boeken en artikels te digitaliseren. Meerdere mensen kregen die foto te zien en tikten braaf het woord in dat ze zagen. Google vergeleek al die inputs en koos voor degene die het meest voorkwam. Zo hebben ze in 2011 de volledige Google-books catalogus afgerond evenals 13 miljoen artikels uit The New York Times.

You’re welcome, Google maps

In 2012 is Google zich met hun reCAPTCHA’s gaan richten op hun steeds populairder wordende Google Maps functie. Ze hadden al een resem aan wazige foto’s van huisnummers via Street View. Maar natuurlijk hadden ze ook heel graag gehad dat iemand hen even ging zeggen welk getal bij welke foto hoorde.
Elke keer je een huisnummer moest overtypen in een reCAPTCHA, heb je eigenlijk de database van Google Maps voorzien van data. Maar daar heeft niemand een bedankje voor gehad.

En nu?

Nu zitten we volgens velen op een kantelpunt voor de technologie. Want met alle ‘werkjes’ ondertussen afgerond, richt Google zich op AI-Learning (het ‘opleren’ van artificiële intelligentie, zeg maar).

Een computer weet niet wat een kat is. Maar als we hem genoeg foto’s geven van katten en hem zeggen: “kijk dit is een kat, en dit, en dit ook, en dit…
Dan leert hij het sneller dan je zou denken. Machine learning noemen ze dat. En aangezien alle computers door een netwerk aan elkaar hangen en er altijd wel iemand online een reCAPTCHA aan het invullen is, stopt het leren nooit.

Maar is het dan perfect?

Natuurlijk niet. Je kan de software gebruiken om zichzelf beet te nemen. Je hoeft hem enkel  genoeg te trainen om de antwoorden te geven die de andere kant horen wil. Eens hij geleerd heeft hoe een kat eruit ziet, zal hij ze uit een reeks foto’s kunnen halen, even goed als eender welke menselijke gebruiker.

Als je hem leert dat een kat er eigenlijk uitziet als een vrachtwagen en hem consequent de verkeerde afbeeldingen voorschotelt, zal hij dat fout gedrag gaan kopieëren en krijg je een vicieuze cirkel van verkeerde info.

Wat vaststaat is dat de technologie de komende jaren enkel nog beter op punt zal komen te staan.
Misschien tot op het punt waar wij -online alleszins- geen onderscheid meer gaan kunnen maken tussen mens en machine.