Před více než 70 lety, kdy byla umělá inteligence konceptualizována, Alan Turing publikoval článek, který popsal, jak ji identifikovat. Později byl známý jako Turingův test a po desetiletí se používá k rozlišení mezi člověkem a AI.
Se zavedením pokročilých chatbotů s umělou inteligencí, jako jsou ChatGPT a Google Bard, je však stále obtížnější zjistit, zda mluvíte s umělou inteligencí. To vyvolává otázku; je Turingův test zastaralý? A pokud ano, jaké jsou alternativy?
Je Turingův test zastaralý?
Chcete-li zjistit, zda je Turingův test zastaralý, musíte nejprve pochopit, jak funguje. Aby umělá inteligence prošla Turingovým testem, musí přesvědčit lidského vyšetřovatele, že je to člověk. Má to ale háček – AI je hodnocena společně s člověkem a musí reagovat pomocí textu.
Přemýšlejte o tom takto; pokud jste tazatel a pokládáte otázky dvěma účastníkům online pomocí textu, ale jeden z nich je model AI – rozeznali byste je po pěti minutách? Mějte na paměti, že cílem Turingova testu není identifikovat model umělé inteligence na základě správných odpovědí, ale vyhodnotit, zda umělá inteligence může myslet nebo se chovat jako člověk.
Problém s Turingovým testovacím přístupem, který pouze identifikuje lidské reakce, je v tom, že nebere v úvahu jiné faktory. Například inteligence modelu AI nebo znalosti vyšetřovatele. Kromě toho je Turingův test omezen pouze na text a je stále obtížnější identifikovat AI, která generuje lidský hlas nebo hluboce falešná videa, která napodobují lidské chování.
Současné modely umělé inteligence jako ChatGPT-4 a Google Bard však ještě nepokročily do bodu, kdy by mohly trvale projít Turingovým testem. Ve skutečnosti, pokud jste obeznámeni s umělou inteligencí, můžete si všimnout textu generovaného umělou inteligencí.
5 nejlepších alternativ Turingova testu
Je možné, že budoucí modely AI jako ChatGPT-5 by mohly projít Turingovým testem. Pokud k tomu dojde, budeme potřebovat různé testy kombinované s Turingovým testem, abychom zjistili, zda mluvíme s AI nebo s člověkem. Zde jsou nejlepší alternativy Turingova testu:
1. Marcusův test
Gary Marcus, renomovaný kognitivní vědec a výzkumník AI, navrhl alternativu k Turingovu testu, který byl publikován v New Yorker, aby identifikoval kognitivní schopnosti AI. Test je jednoduchý – posuzujete model umělé inteligence na základě jeho schopnosti sledovat a porozumět videím a televizním pořadům YouTube bez titulků nebo textu. Aby umělá inteligence prošla Marcusovým testem, měla by při sledování videí rozumět sarkasmu, humoru, ironii a příběhu a vysvětlit to jako člověk.
V tuto chvíli umí GPT-4 popisovat obrázky, ale zatím neexistuje žádný model umělé inteligence, který by dokázal pojmout videa jako člověk. Samořídící vozidla se přibližují, ale nejsou zcela autonomní a vyžadují senzory, protože nemohou porozumět všemu v okolním prostředí.
2. Vizuální Turingův test
Podle výzkumného článku zveřejněného na PNAS lze vizuální Turingův test použít k identifikaci, zda mluvíte s člověkem nebo s AI pomocí obrázkových dotazníků. Funguje to jako Turingův test, ale místo odpovídání na otázky pomocí textů se účastníkům zobrazují obrázky a očekává se, že budou odpovídat na jednoduché otázky a přitom přemýšlet jako člověk. Vizuální Turingův test se však od CAPTCHA liší, protože všechny odpovědi jsou správné – ale aby test prošel, musí AI zpracovat obrázky podobně jako člověk.
Kromě toho, pokud je AI a člověku zobrazeno několik obrázků vedle sebe a požádáni o identifikaci realistických obrázků, člověk by měl kognitivní schopnost projít testem. Je to proto, že pro modely umělé inteligence je obtížné rozlišit snímky, které nevypadají, jako by byly pořízeny ve skutečném světě. Ve skutečnosti to je důvod, proč můžete identifikovat obrázky generované AI pomocí anomálií, které nedávají smysl.
3. Test Lovelace 2.0
Teorii, že počítač nemůže vytvářet originální nápady nad rámec toho, k čemu byl naprogramován, poprvé konceptualizovala Ada Lovelace před Turingovým testem. Alan Turing se však proti této teorii ohradil a tvrdil, že umělá inteligence může člověka stále překvapovat. Až v roce 2001 byly vyvinuty pokyny pro test Lovelace, aby bylo možné odlišit AI od člověka – a podle thekurzweillibrary byla pravidla později revidována v roce 2014.
Aby umělá inteligence prošla testem Lovelace, musí prokázat, že dokáže generovat originální nápady, které přesahují její výcvik. Současné modely umělé inteligence, jako je GPT-4, nemají schopnost přicházet s novými vynálezy nad rámec našich stávajících znalostí. Umělá obecná inteligence však může této schopnosti dosáhnout a projít testem Lovelace.
4. Reverzní Turingův test
Co takhle Turingův test, ale provedený obráceně? Namísto snahy zjistit, zda mluvíte s člověkem, je cílem obráceného Turingova testu přimět AI, aby uvěřila, že jste AI. K zodpovězení stejných otázek pomocí textu však potřebujete také jiný model umělé inteligence.
Pokud je například dotazovatelem ChatGPT-4, můžete jako účastníky zaregistrovat Google Barda a dalšího člověka. Pokud model AI dokáže na základě odpovědí správně identifikovat lidského účastníka, prošel testem.
Nevýhodou reverzního Turingova testu je, že je nespolehlivý, zvláště když vezmeme v úvahu, že někdy umělá inteligence nedokáže odlišit obsah vytvořený umělou inteligencí a obsah napsaný lidmi.
5. Klasifikační rámec umělé inteligence
Podle klasifikačního rámce AI vyvinutého Chrisem Saadem je Turingův test pouze jednou z metod hodnocení, jak zjistit, zda mluvíte s AI. Stručně řečeno, klasifikační rámec AI je založen na teorii vícenásobné inteligence, která vyžaduje, aby lidská inteligence splňovala alespoň osm různých kritérií, mezi něž patří: hudební rytmus, logicko-matematická inteligence, vizuální identifikace, emoční inteligence, sebereflektivní inteligence. , schopnost existenciálního myšlení a pohyb těla.
Vzhledem k tomu, že AI je hodnocena na základě osmi různých parametrů, je nepravděpodobné, že by pro člověka prošla, i když v určitých benchmarcích funguje lépe než průměr. ChatGPT může například řešit matematické problémy, popisovat obrázky a konverzovat v přirozeném jazyce jako člověk, ale selhal by u jiných kategorií definovaných v rámci klasifikace AI.
Turingův test není přesvědčivý
Turingův test měl být spíše myšlenkovým experimentem než průkazným testem k rozlišení mezi lidmi a AI. Když byl původně navržen, byl stěžejním měřítkem pro měření inteligence strojů.
S nedávným vývojem modelů umělé inteligence s řečovými, vizuálními a sluchovými interaktivními schopnostmi však Turingův test zaostává, protože je omezen na textovou konverzaci. Nejúčinnějším řešením by bylo zavedení Turingových testovacích alternativ, které dále odlišují modely umělé inteligence od lidí.