Llama 3 a GPT-4 jsou dva nejpokročilejší modely velkých jazyků (LLM) dostupné veřejnosti. Podívejme se, který LLM je lepší porovnáním obou modelů z hlediska multimodality, délky kontextu, výkonu a nákladů.
Co je GPT-4?
GPT-4 je nejnovější model velkého jazyka (LLM) vyvinutý společností OpenAI. Staví na základech starších modelů GPT-3 a využívá různé tréninkové techniky a optimalizace využívající mnohem větší datovou sadu. To výrazně zvýšilo velikost parametrů GPT-4, o kterém se říká, že má dohromady 1,7 bilionu parametrů z jeho menších expertních modelů. Díky novému školení, optimalizacím a většímu počtu parametrů poskytuje GPT-4 vylepšení v uvažování, řešení problémů, porozumění kontextu a lepší manipulaci s nuancovanými instrukcemi.
V současné době existují tři varianty modelu:
- GPT-4: Evoluce z GPT-3 s významnými vylepšeními v rychlosti, přesnosti a znalostní základně.
- GPT-4 Turbo: Optimalizovaná verze GPT-4 navržená tak, aby poskytovala rychlejší výkon a zároveň měla nižší provozní náklady.
- GPT-4o (všechny): Rozšiřuje možnosti GPT-4 integrací multimodálních vstupů a výstupů, včetně textu, obrazu a zvuku.
Nyní můžete přistupovat ke všem třem modelům GPT-4 po přihlášení k odběru služeb API OpenAI, interakci s ChatGPT nebo prostřednictvím služeb, jako je Descript, Perplexity AI a různých kopilotů od společnosti Microsoft.
Co je Llama 3?
Llama 3 je open source LLM vyvinutý společností Meta AI (mateřská společnost Facebooku, Instagramu a WhatsApp), trénovaný pomocí kombinace kontrolovaného jemného ladění, vzorkování odmítnutí a optimalizace zásad s různorodou datovou sadou zahrnující miliony lidmi anotovaných příklady. Jeho školení se zaměřilo na vysoce kvalitní výzvy a hodnocení preferencí s cílem vytvořit všestranný a schopný model umělé inteligence.
V současnosti jsou veřejnosti k dispozici dva modely Llama 3: Llama 3 8B a Llama 3 70B. „B“ znamená miliardu a ukazuje na velikost parametru modelu. Meta také trénuje model Llama 3 400B, jehož uvedení na trh se očekává koncem roku 2024.
K Llamě 3 máte přístup prostřednictvím Meta AI, jejího generativního chatbota AI. Alternativně můžete LLM spustit lokálně na vašem počítači stažením modelů Llama 3 a jejich načtením přes Ollama, Open WebUI nebo LM Studio.
Multimodalita
Vydání GPT-4o konečně přineslo počáteční marketing GPT-4 s multimodálními schopnostmi. K těmto multimodálním funkcím lze nyní přistupovat interakcí s ChatGPT pomocí modelu GPT-4o. Od června 2024 nemá GPT-4o žádný integrovaný způsob generování videa a zvuku. Má však schopnosti generovat text a obrázky na základě video a audio vstupů.
Llama 3 také plánuje poskytnout multimodální model pro nadcházející Llama 3 400B. S největší pravděpodobností bude integrovat podobné technologie jako CLIP (Contrast Language-Imager Pre-Training) pro generování obrázků pomocí technik učení zero-shot. Ale protože Llama 400B je stále ve výcviku, jediný způsob, jak pro modely 8B a 70B generovat obrázky, je použít rozšíření jako LLaVa, Visual-LLaMA a LLaMA-VID. Od nynějška je Llama 3 čistě jazykový model, který může používat text, obrázek a zvuk jako vstupy pro generování textu.
Délka kontextu
Délka kontextu označuje množství textu, které model dokáže zpracovat najednou. Je to důležitý faktor při zvažování schopností LLM, protože určuje množství kontextu, se kterým může model pracovat při interakci s uživateli. Obecně platí, že větší délka kontextu dělá LLM lepší, protože poskytuje vyšší úroveň koherence, kontinuity a může snížit opakování chyb během interakcí.
Modely Llama 3 mají délku kontextu efektivně 8 000 tokenů (přibližně 6 400 slov). To znamená, že model Llama 3 bude mít v rámci vaší interakce kontextovou paměť přibližně 6 400 slov. Jakákoli slova přesahující limit 8 000 tokenů budou zapomenuta a během interakce neposkytnou žádný další kontext.
Naproti tomu GPT-4 nyní podporuje výrazně větší délku kontextu 32 000 tokenů (kolem 25 600 slov) pro uživatele ChatGPT a 128 000 tokenů (kolem 102 400 slov) pro ty, kteří používají koncové body API. To dává modelům GPT-4 výhodu při správě rozsáhlých konverzací a schopnost číst dlouhé dokumenty nebo dokonce celou knihu.
Výkon
Porovnejme výkon pohledem na Llama 3, 18. dubna 2024, benchmark report od Meta AI a GPT-4, 14. května 2024, GitHub report od OpenAI. Zde jsou výsledky:
Zde je to, co každé kritérium hodnotí:
- MMLU (Massive Multitask Language Understanding): Posuzuje schopnost modelu porozumět otázkám z různých akademických předmětů a reagovat na ně.
- GPTQA (odpověď na otázky pro obecné účely): Hodnotí dovednost modelu odpovídat na faktické otázky v otevřené doméně
- MATEMATIKA: Otestujte schopnost modelu řešit matematické problémy.
- HumanEval: Měří schopnost modelu generovat správný kód na základě daných programovacích výzev od lidí.
- DROP (Diskrétní zdůvodnění nad odstavci): Hodnotí schopnost modelu provádět diskrétní uvažování a odpovídat na otázky na základě textových pasáží.
Nedávné benchmarky zdůrazňují rozdíl ve výkonu mezi modely GPT-4 a Llama 3. Ačkoli se zdá, že model Llama 3 8B výrazně zaostává, modely 70B a 400B poskytují nižší, ale podobné výsledky jako modely GPT-4o a GPT-4 Turbo, pokud jde o akademické a obecné znalosti, čtení a porozumění, uvažování a logiku a kódování. Žádný model Llama 3 se však z hlediska čisté matematiky ještě nepřiblíží výkonu GPT-4.
Náklady
Cena je pro mnoho uživatelů kritickým faktorem. Model GPT-4o OpenAI je k dispozici všem uživatelům ChatGPT zdarma s limitem 16 zpráv každé 3 hodiny. Pokud potřebujete více, budete se muset přihlásit k odběru ChatGPT Plus, který stojí 20 USD měsíčně, abyste rozšířili limit zpráv GPT-4o na 80 a zároveň měli přístup k dalším modelům GPT-4.
Na druhou stranu jsou oba modely Llama 3 8B i 70B zdarma a s otevřeným zdrojovým kódem, což může být významnou výhodou pro vývojáře a výzkumníky, kteří hledají cenově výhodné řešení bez kompromisů ve výkonu.
Přístupnost
Modely GPT-4 jsou široce přístupné prostřednictvím generativního chatbota ChatGPT společnosti OpenAI a prostřednictvím jeho API. GPT-4 můžete také používat na Microsoft Copilot, což je jeden ze způsobů, jak můžete GPT-4 používat zdarma. Tato široká dostupnost zajišťuje, že uživatelé mohou snadno využít jeho schopnosti v různých případech použití. Naproti tomu Llama 3 je open-source projekt, který poskytuje flexibilitu modelu a podporuje širší experimentování a spolupráci v rámci komunity AI. Tento přístup s otevřeným přístupem může demokratizovat technologii AI a zpřístupnit ji mnohem širšímu publiku.
Přestože jsou oba modely snadno dostupné, použití GPT-4 je mnohem jednodušší, protože je integrováno do oblíbených nástrojů a služeb pro zvýšení produktivity. Na druhou stranu je Llama 3 integrována hlavně do výzkumných a obchodních platforem, jako je Amazon Bedrock, Ollama a DataBricks (kromě Meta AI chat assist), což není přitažlivé pro větší trh netechnických uživatelů.
GPT-4 vs. Llama 3: Co je lepší?
Takže, která LLM je lepší? Řekl bych, že GPT-4 je lepší LLM. GPT-4 vyniká v multimodalitě s pokročilými možnostmi zpracování textových, obrazových a zvukových vstupů, zatímco podobné funkce Llama 3 jsou stále ve vývoji. GPT-4 také nabízí mnohem větší délku kontextu a lepší výkon a je široce přístupný prostřednictvím oblíbených nástrojů a služeb, díky čemuž je uživatelsky přívětivější.
Je však důležité zdůraznit, že modely Llama 3 fungovaly výjimečně dobře pro bezplatný a open source projekt. Výsledkem je, že Llama 3 zůstává výjimečným LLM, upřednostňovaným výzkumníky a podniky pro svou beznákladovou a open source povahu a zároveň poskytuje působivý výkon, flexibilitu a spolehlivé funkce ochrany soukromí. Zatímco běžní spotřebitelé nemusí najít okamžité použití pro Llama 3, zůstává nejschůdnější možností pro mnoho výzkumníků a podniků.
Závěrem lze říci, že ačkoli GPT-4 vyniká svými pokročilými multimodálními schopnostmi, větší délkou kontextu a bezproblémovou integrací do široce používaných nástrojů, Llama 3 nabízí cennou alternativu díky své open source povaze, která umožňuje větší přizpůsobení a úsporu nákladů. Z hlediska aplikace je tedy GPT-4 ideální pro ty, kteří hledají snadné použití a komplexní funkce v modelu, zatímco Llama 3 je vhodná pro vývojáře a výzkumníky, kteří hledají flexibilitu a přizpůsobivost.