Google nedávno uzavřel svou událost Cloud Next 2024, kde vyhledávací gigant zpřístupnil Gemini 1.5 Pro všem uživatelům jako součást veřejného náhledu. A s tím také otevřel API přístup k modelu Gemini 1.5 Pro pro všechny uživatele. Dříve Google uvolnil přístup k API pro Gemini 1.0 Pro, ale vývojáři čekali na tento vysoce slibný model. V současné době je API zdarma k použití a zůstane tomu tak do 1. května 2024. Pokud tedy chcete získat přístup a používat klíč API Gemini 1.5 Pro k vyhodnocení modelu, postupujte podle našeho průvodce níže.
Získejte klíč API pro Gemini 1.5 Pro
- Zamiřte k aistudio.google.com/app/apikey (návštěva) a přihlaste se pomocí svého účtu Google.
- Klikněte na „Vytvořit klíč API“ a vyberte jeden z projektů.
- Nyní klikněte na „Vytvořte klíč API ve stávajícím projektu“.
- A je to! Klíč API Gemini 1.5 Pro bude vygenerován okamžitě. Zkopírujte a uložte to bezpečně.
Jak používat klíč API Gemini 1.5 Pro
Ukážu několik příkladů v Pythonu, jak používat klíč API Gemini 1.5 Pro pro textové i obrázkové příklady. Zde jsou kroky, které je třeba dodržet.
- Nejprve se ujistěte, že jste na svůj počítač nainstalovali Python spolu s Pip.
- Poté spusťte terminál a spusťte níže uvedené příkazy k instalaci Závislosti Blíženců a Polštář pro manipulaci s obrázky.
pip install -q -U google-generativeai pip install Pillow
- Jakmile to uděláte, otevřete editor kódu podle vašeho výběru Poznámkový blok++ nebo Sublime. Můžete také otevřít Visual Studio Code pro lepší prostředí IDE.
- Dále zkopírujte a pasta níže uvedený kód do editoru kódu.
import google.generativeai jako genai genai.configure(api_key=’XXXXXXXXXXXXXXXXXXXX‘) model = genai.GenerativeModel(‚gemini-1.5-pro-latest‘) response = model.generate_content(„vysvětlete Moorův zákon jako já 5“) print( odpověď.text)
- Zde jsem definoval model jako gemini-1.5-pro-nejnovější a použil můj vlastní klíč API. V dalším řádku můžete nastavit svou otázku.
- Nyní uložte soubor s příponou .py a spusťte soubor ve svém terminálu. Jak můžete vidět, Gemini 1.5 Pro správně vysvětluje pojem přesně jak jsem o to požádal.
- Protože Gemini 1.5 Pro je multimodální model, můžete také předat obrázek pomocí níže uvedeného kódu, abyste ověřili jeho schopnost vidění.
import google.generativeai jako genai import PIL.Image img = PIL.Image.open(„image.png“) genai.configure(api_key=’XXXXXXXXXXXXXXXXXXX‘) model = genai.GenerativeModel(‚gemini-1.5-pro-latest‘) odpověď = model.generate_content([„what do you see in this image“, img]) tisk (odpověď.text)
- Zde ukazuji na místního „obrázek.png”, který je ve stejném adresáři jako soubor Python, a položí otázku níže. gemini-1.5-pro-latest podporuje zadávání textu a obrázků v jediném modelu.
- Nyní jednoduše spusťte kód a voila! Bude analyzovat obrázek a vytisknout výsledek. Při práci s obrázky mi to přišlo docela přesné.
Tak můžete získat přístup ke klíči API pro Gemini 1.5 Pro a otestovat jej pomocí Pythonu. Google mimochodem nezveřejnil podrobnou dokumentaci k modelu Gemini 1.5 Pro. Až Google aktualizuje své zdroje, přidáme do tohoto článku další příklady kódování. Každopádně to je od nás vše. Pokud narazíte na nějaké problémy, dejte nám vědět v sekci komentářů níže.