Odemykání síly Gemini 1.5 Pro API: Postupný průvodce

Odemykání síly Gemini 1.5 Pro API: Postupný průvodce

Google nedávno uzavřel svou událost Cloud Next 2024, kde vyhledávací gigant zpřístupnil Gemini 1.5 Pro všem uživatelům jako součást veřejného náhledu. A s tím také otevřel API přístup k modelu Gemini 1.5 Pro pro všechny uživatele. Dříve Google uvolnil přístup k API pro Gemini 1.0 Pro, ale vývojáři čekali na tento vysoce slibný model. V současné době je API zdarma k použití a zůstane tomu tak do 1. května 2024. Pokud tedy chcete získat přístup a používat klíč API Gemini 1.5 Pro k vyhodnocení modelu, postupujte podle našeho průvodce níže.

Získejte klíč API pro Gemini 1.5 Pro

  • Zamiřte k aistudio.google.com/app/apikey (návštěva) a přihlaste se pomocí svého účtu Google.
  • Klikněte na „Vytvořit klíč API“ a vyberte jeden z projektů.
  • Nyní klikněte na „Vytvořte klíč API ve stávajícím projektu“.
vyberte projekt v google ai studio
  • A je to! Klíč API Gemini 1.5 Pro bude vygenerován okamžitě. Zkopírujte a uložte to bezpečně.
vygenerován klíč API gemini 1.5 pro

Jak používat klíč API Gemini 1.5 Pro

Ukážu několik příkladů v Pythonu, jak používat klíč API Gemini 1.5 Pro pro textové i obrázkové příklady. Zde jsou kroky, které je třeba dodržet.

  • Nejprve se ujistěte, že jste na svůj počítač nainstalovali Python spolu s Pip.
  • Poté spusťte terminál a spusťte níže uvedené příkazy k instalaci Závislosti Blíženců a Polštář pro manipulaci s obrázky.

pip install -q -U google-generativeai pip install Pillow

nainstalovat google generative ai dependency
  • Jakmile to uděláte, otevřete editor kódu podle vašeho výběru Poznámkový blok++ nebo Sublime. Můžete také otevřít Visual Studio Code pro lepší prostředí IDE.
  • Dále zkopírujte a pasta níže uvedený kód do editoru kódu.

import google.generativeai jako genai genai.configure(api_key=’XXXXXXXXXXXXXXXXXXXX‘) model = genai.GenerativeModel(‚gemini-1.5-pro-latest‘) response = model.generate_content(„vysvětlete Moorův zákon jako já 5“) print( odpověď.text)

  • Zde jsem definoval model jako gemini-1.5-pro-nejnovější a použil můj vlastní klíč API. V dalším řádku můžete nastavit svou otázku.
ukázkový kód pro testování gemini 1.5 pro api
  • Nyní uložte soubor s příponou .py a spusťte soubor ve svém terminálu. Jak můžete vidět, Gemini 1.5 Pro správně vysvětluje pojem přesně jak jsem o to požádal.
gemini 1.5 pro api vysvětlující koncept v terminálu
  • Protože Gemini 1.5 Pro je multimodální model, můžete také předat obrázek pomocí níže uvedeného kódu, abyste ověřili jeho schopnost vidění.

import google.generativeai jako genai import PIL.Image img = PIL.Image.open(„image.png“) genai.configure(api_key=’XXXXXXXXXXXXXXXXXXX‘) model = genai.GenerativeModel(‚gemini-1.5-pro-latest‘) odpověď = model.generate_content([„what do you see in this image“, img]) tisk (odpověď.text)

  • Zde ukazuji na místního „obrázek.png”, který je ve stejném adresáři jako soubor Python, a položí otázku níže. gemini-1.5-pro-latest podporuje zadávání textu a obrázků v jediném modelu.
  • příklady kódování pro demonstraci gemini 1.5 pro vision api.jpg
  • ukázkový obrázek jídla k předání gemini 1.5 pro API .jpg

  • Nyní jednoduše spusťte kód a voila! Bude analyzovat obrázek a vytisknout výsledek. Při práci s obrázky mi to přišlo docela přesné.
gemini 1.5 pro api analyzující obraz a výstup v terminálu

Tak můžete získat přístup ke klíči API pro Gemini 1.5 Pro a otestovat jej pomocí Pythonu. Google mimochodem nezveřejnil podrobnou dokumentaci k modelu Gemini 1.5 Pro. Až Google aktualizuje své zdroje, přidáme do tohoto článku další příklady kódování. Každopádně to je od nás vše. Pokud narazíte na nějaké problémy, dejte nám vědět v sekci komentářů níže.

Viz také:  Šéf AI společnosti Microsoft odhaluje tajné plány Walmartu uprostřed protestu pro Palestinu