Életünk egyre több területén döntenek a gépek. Algoritmusok, gépi tanulási módszerek hoznak gyors döntéseket, melyek kihatnak életünkre. Kapunk-e hitelt, mennyi biztosítási díjat fizetünk, van-e kóros elváltozás egy szövetmintában, milyen filmeket ajánl nekünk kedvenc on-demand szolgáltatónk? Lassan megemésztjük, hogy a statisztikai módszer nem jár százszázalékos eredménnyel, de legalább amit csinál egy gép, azt csinálja akkor jól és konzisztensen. A gépek hatással vannak ránk, jó lenne tudni bízhatunk-e bennük...
Az ún. négyszín-tétel a Wikipedia szerint "azt állítja, hogy egy tetszőleges régiókra osztott síkot, akár egy politikai térképet egy ország megyéiről, ki lehet úgy színezni legfeljebb négy szín felhasználásával, hogy ne legyen két azonos színű szomszédos régió." Amennyire egyszerűnek tűnik a kérdés, annyira nehéz volt bizonyítani! Appel és Haken bizonyítása alaposan felkavarta az elméleti matematika világát, mivel számítógépek végezték a munka jelentős részét. Sőt a bizonyítás korrektségének ellenőrzéséhez is számítógép szükségeltetik, amiért a matematika filozófiájával foglalkozók közül sokan nem is tekintik igazán bizonyítottnak a tételt, mások szerint ezzel a lépéssel a matematika elmozdult a természettudományok irányába (l. bővebben Tymoczko remek tanulmányát). A lényeg, hogy a bizonyítás majdnem 1500 konfigurációt vizsgál meg, hogy induktív módon "megmutassa" minden esetben elegendő a négy szín a térkép színezéséhez.
A gépi tanulás során általában az adatok alapján az algoritmus létrehoz egy absztrakciót, mely segítségével generalizálhat más, még nem látott esetekre. Ahogyan a négyszín-tétel bizonyítása sem fogható fel emberi ésszel, a gépi tanulás lépései is követhetetlenek egy ember számára. Egyik esetben sem arról van szó, hogy nem érthetőek! Formálisan definiált lépésekről van szó, a dolog "logikáját" értjük, csak nem tudjuk mi magunk elvégezni a szükséges lépéseket (különösen nem nagy számban, egymás után, gyorsan). Ahhoz, hogy meggyőződjünk arról, hogy ezen algoritmusok jól működnek, egyrészt formális bizonyítások szükségeltetnek (általában gépi úton végzik ezt is) illetve alaposan tesztelni kell a rendszereket.
A tesztelés tkp. a tudományos módszer alkalmazása a fejlesztésben. Karl Popper tette népszerűvé a falszifikáció fogalmát, ami annyit tesz, hogy egy rendes elmélet megadja cáfolhatóságának kritériumait. Egy rendes fejlesztés során nem csak arra ügyelnek, hogy mit kell tudnia egy szoftvernek, meg kell próbálni megcáfolni a működését is. A gépekben is csak annyira bízhatunk, mint a tudományban! Azonban manapság a tudománynál nincs jobban működő, transzparens, saját hibáinak kijavítását szem előtt tartó dolog a világon! A gépek hibázni fognak, kételkedni kell bennünk, ellenben tanulnak hibáikból és fejlődnek!