Klíčové věci
- Claude 3 od Anthropic nabízí výrazný skok oproti Claude 2 a překonává GPT-4 v různých úkolech.
- S Claude 3 můžete generovat odpovědi na řadu dotazů v různých oblastech, to vše bez poplatku za předplatné.
- Claude 3 dobře konkuruje ChatGPT GPT-4, vyniká v oblastech, jako jsou programovací úlohy, kreativní psaní a velikost kontextového okna.
Společnost Anthropic oznámila vydání Claude 3 – rodiny modelů AI s potenciálem rozrušit GPT-4. Má vynikající potenciál, ale je připraven převzít korunu ChatGPT?
Co je Claude 3?
Claude 3 je rodina tří multimodálních modelů umělé inteligence vyvinutá společností Anthropic jako náhrada za řadu modelů umělé inteligence Claude 2. Dalo by se říci, že Claude 3 je odpovědí Anthropic na Gemini od Googlu a GPT-4 od OpenAI. Claude 3, vydaný ve třech verzích, Haiku, Sonnet a Opus, v jejich rostoucím pořadí inteligence, je prvním multimodálním modelem AI společnosti Anthropic a představuje významný skok oproti sérii Claude 2.
Nyní, pokud jste nikdy neslyšeli o chatbotovi Claude AI, je to pochopitelné. Claude a jeho základní modely nemají status superhvězdy ChatGPT ani přitažlivost značky Gemini od Googlu. Claude je však nepochybně jedním z nejpokročilejších chatbotů s umělou inteligencí na světě, který v několika klíčových oblastech překonává tolik vychvalovaný ChatGPT.
Abychom Claude 3 skutečně ocenili, je důležité ohlédnout se za neúspěchy předchozích modelů.
- Dřívější iterace Clauda měly pověst příliš horlivého přístupu k bezpečnosti AI. Bezpečnostní prvky Claude 2 byly například tak těsné, že se chatbot vyhnul příliš mnoha tématům, a to i těm, která nemají jasné bezpečnostní problémy.
- Vyskytly se také problémy s kontextovým oknem modelu. Když požádáte model umělé inteligence, aby něco vysvětlil nebo, řekněme, shrnul dlouhý článek, představte si, že dokáže přečíst pouze několik odstavců článku najednou. Tento limit množství textu, který může najednou vzít v úvahu, se nazývá „kontextové okno“. Dřívější verze Claude přicházely s 200k tokenem (ekvivalentem 150 000 slov) kontextovým oknem. Model však nebyl schopen prakticky zvládnout tolik textu najednou, aniž by jeho kousky zapomněl.
- Byla zde také otázka multimodality. Téměř každý hlavní model umělé inteligence přešel na multimodální, což znamená, že může zpracovávat jiné formy dat, jako jsou obrázky, a reagovat na tato data (spíše než jen zadávat text). Claude toho nebyl schopen.
Všechny tři problémy byly nyní zcela nebo alespoň částečně vyřešeny vydáním Claude 3.
Co můžete dělat s Claude 3?
Stejně jako většina špičkových generativních modelů umělé inteligence dokáže Claude 3 generovat špičkové odpovědi na různé dotazy v různých oblastech. Ať už potřebujete rychle vyřešit problém s algebrou, napsat zbrusu novou skladbu, podrobný návrh článku, napsaný kód pro software nebo analyzovat rozsáhlou sadu dat, Claude 3 se hodí.
Ale většina modelů umělé inteligence už tyto úkoly umí, tak proč používat Claude 3?
Odpověď je jednoduchá; Claude 3 není jen další model AI, který je v těchto úkolech dobrý, je to nejpokročilejší volně dostupný multimodální model AI, který můžete získat kdekoli na internetu. Ano, existuje Gemini, velmi medializovaný, předpokládaný zabiják GPT-4 od Googlu, který si působivě vede v benchmarkových testech. Nicméně, Anthropic tvrdí, že Claude 3 jej překonává s působivým náskokem v několika úkolech. Zatímco výsledky benchmarků jsou něco, co bychom často měli brát s rezervou, otestoval jsem oba modely umělé inteligence a převaha modelu Claude 3 v několika důležitých případech použití byla velmi jasná.
Claude 3 vám tedy umožňuje dělat většinu věcí, které můžete dělat s Gemini a GPT-4 (bez generování obrázků), aniž byste museli platit poplatek 20 USD za prémii ChatGPT.
Claude 3 vs. ChatGPT
Rychlý způsob, jak otestovat výkon modelu umělé inteligence, je zkontrolovat, jak dobře obstojí ve srovnání s nejlepšími na trhu: GPT-4. Oba modely jsem samozřejmě otestoval; jak dobře obstojí Anthropic’s Claude 3 proti kolosálnímu GPT-4?
Claude vs. ChatGPT: Dovednosti kódování
Počínaje řetězcem programovacích úloh se Claude 3 vyrovnal schopnostem GPT -4 ve všech prezentovaných základních programovacích úlohách a v některých je dokonce překonal. Zatímco jsem testoval pouze základy, předchozí verze Claude byla výrazně méně zdatná ve stejných úkolech, když jsme ji testovali v tomto srovnání ChatGPT vs. Claude v září 2023. Když jsme například požádali oba modely, aby vytvořily jednoduchý úkol seznam, Claude selhal ve všech případech, zatímco ChatGPT předvedl to, co bychom v té době nazvali pětihvězdičkovým výkonem.
S nejnovější verzí vytvořil Claude 3 výkonnější aplikaci seznamu úkolů ve všech třech testovaných případech. Zde je výsledek GPT-4, když jste vyzváni k vytvoření aplikace se seznamem úkolů.
A tady je výsledek Clauda 3, když byl požádán, aby udělal totéž.
Obě aplikace byly do určité míry funkční, ale je jasné, že Claude 3 v této odvedl lepší práci.
Po vyzkoušení složitějších programovacích testů byl Claude v několika případech lepším modelem, zatímco GPT-4 měl také své výhry. I když nemohu jednoznačně říci, že Claude 3 je lepší v programovací logice, pokud by mezi těmito dvěma modely byla obrovská mezera, tato mezera by se téměř jistě zmenšila.
Claude vs. ChatGPT: Uvažování zdravého rozumu
Pokračoval jsem v testování obou modelů na základě zdravého rozumu. Práce s AI chatboty je zajímavý paradox. Chatboti s umělou inteligencí dokážou snadno zvládnout složité úkoly, ale často se potýkají se základními problémy, které vyžadují zdravý rozum nebo logiku. Oběma modelům jsme tedy dali řadu zdánlivě jednoduchých otázek, které ke správné odpovědi vyžadovaly zdravý rozum.
Z pěti takových otázek oba modely odpověděly logicky na všech pět. Oběma chatbotům jsme položili jednu takovou otázku: Pokud se vesmírná loď z Marsu rozlomí na dvě části, přičemž jedna část se zřítí do Atlantského oceánu u Brazílie a druhá do Tichého oceánu u Japonska, kde pohřbíte přeživší?
ChatGPT odpověděl správně i bez GPT-4. Pokud vás zajímá důvod výběru otázky, chatboti v historii tohoto druhu dotazování žalostně selhali. Dále byl na řadě Claude, aby odpověděl.
Claudeova odpověď nebyla přesně definitivní odpovědí, ale dokázala identifikovat klíčové informace; přeživší nepohřbíváte. Je důležité poznamenat, že když jsme naposledy položili stejnou otázku Claudeovi 2, nebyl schopen vidět past zdravého rozumu.
Claude vs. ChatGPT: Kreativní psaní
V reálném světě je jedním z nejoblíbenějších případů použití chatbotů AI generování kreativního textu ve všech formách: články, dopisy, texty písní, co si jen vzpomenete. Takže jsem testoval oba modely, abych zjistil, který vytváří lépe lidsky znějící text.
Myšlenka je, že výsledky by neměly být jen „správné“ nebo kreativní (v robotickém způsobu), ale měly by znít, jako by je napsal člověk. Oběma modelkám jsem dal za úkol složit text k rapové písni o pěstování okurek a stát se z nich milionářem. Kdo píše rapové písně o okurkách? To je nápad – něco náročného!
Zde je záběr ChatGPT:
A tady je Claudeova odpověď pomocí stejné výzvy.
Může to být subjektivní, ale Claude se zde zdá být lepší volbou. Když byly oba nástroje pověřeny vypracováním tří článků na různá témata, Claude ve všech třech případech poskytl lepší možnost. Výsledkem byl více lidský výsledek a vyhnulo se vzorům běžně spojovaným s texty generovanými umělou inteligencí, jako jsou nadsázky, použití složitých slov a sporadické použití spojujících slov.
Claude vs. ChatGPT: Schopnosti rozpoznávání obrázků
Abychom otestovali schopnosti rozpoznávání obrázků, nakrmili jsme ChatGPT a Claude několika obrázky oblíbených vysokých budov po celém světě. ChatGPT správně identifikoval všech 20 z nich, zatímco Claude 3 některé nedokázal identifikovat, včetně poměrně populární dubajské Marina 101, Lotte World Tower v Soulu a budovy Merdeka 118 v Kuala Lumpur v Malajsii.
Na rozdíl od ChatGPT se Claude potýkal s identifikací budov mezi ostatními a míra poruch se zvýšila, pokud budova nebyla v USA nebo Číně. Nemělo však problém identifikovat zamlžené verze Eiffelovy věže nebo Empire State Building.
ChatGPT je v tomto jednoznačně lepší, ale vzhledem k tomu, že Claude 3 je prvním pokusem Anthropicu o vybudování multimodálního modelu umělé inteligence, nebyl to špatný výlet.
Přestože modely velkých jmen, jako je Palm 2 od Googlu a následně Gemini, byly vždy nabízeny jako potenciální zabijáci GPT-4, důsledně jsme tvrdili, že méně známá Claude AI bude pravděpodobně mít tuto čest od svého prvního vydání v březnu 2023. Po několika měsících a několika iteracích vypadá Claude 3 přesně jako zabiják GPT-4, jak jsme ho očekávali. Pokud jste náročný uživatel chatbota, ale nevyzkoušeli jste chatbota Claude AI, přicházíte o nesmírně vlivný nástroj AI, který může zvýšit vaši produktivitu.