Amazon odhaluje Amazon Nova: Nové AI modely pro generování textu, obrázků a videa.

Amazon odhaluje Amazon Nova: Nové AI modely pro generování textu, obrázků a videa.

Generální ředitel Amazonu Andy Jassy vystoupil na úterní konferenci společnosti re:Invent, aby předvedl šest nových modelů generování textu, obrázků a videa, které nazývá Amazon Nova.

Tato nová rodina multimodálních generativních AI zahrnuje Nova Micro, pouze textový model vytvořený pro nízkonákladové reakce s nízkou latencí; Nova Lite, nízkonákladový multimodální model pro zpracování obrazových, video a textových vstupů; a Nova Pro, její univerzální multimodální model, který kombinuje „přesnost, rychlost a cenu pro širokou škálu úkolů“ podle oznámení společnosti. Nova Premier je „nejschopnější… multimodální modely pro složité úlohy uvažování“, zatímco Nova Canvas je specializovaný engine pro převod textu na obrázek a Nova Reel je účelově vytvořený pro generování videa.

Doporučená videa

Textové modely byly optimalizovány pro 15 různých jazyků. Micro nabízí kontextové okno se 128 000 tokeny, zatímco Lite i Pro zvládnou až 300 000 tokenů (přibližně 225 000 slov nebo 30 minut videa). Společnost plánuje do začátku příštího roku rozšířit kontextová okna svých větších modelů až na 2 miliony tokenů.

Canvas umožňuje uživatelům vytvářet a upravovat obrázky pomocí výzev v přirozeném jazyce. Kotouče, které budou konkurovat modelům Gen-3 Alpha, Kling a Dall-E 3, mohou generovat klipy dlouhé až šest sekund z textových výzev a referenčních obrázků. Videogenerátor také nabízí ovládání pohybu kamery včetně posouvání a přibližování.

Pasta City, vytvořené pomocí Amazon Nova Reel od Amazon Ads

„Pokračovali jsme v práci na našich vlastních hraničních modelech,“ řekla Jassy shromážděnému davu, „a tyto hraniční modely udělaly za posledních čtyři až pět měsíců obrovský pokrok. A usoudili jsme, že pokud bychom v nich našli hodnotu, pravděpodobně byste v nich našli hodnotu.“

Jassy také říká, že tyto modely patří k nejlevnějším v provozu a zároveň nejrychlejším ve své třídě, ačkoli společnost ještě nezveřejnila srovnávací data podporující tato tvrzení. „Optimalizovali jsme tyto modely pro práci s proprietárními systémy a rozhraními API, takže s těmito modely můžete mnohem snadněji provádět více řízených automatických kroků – chování agentů,“ řekl. „Takže si myslím, že jsou velmi přesvědčivé.“

Všechny modely Micro, Lite a Pro (stejně jako Canvas a Reels) jsou v současné době k dispozici zákazníkům AWS. Premiéra je naplánována na Q1 2025.

Ve vztahu :  Ultimátní průvodce prohlížením a odstraňováním historie Google Lens.