ChatGPT představuje pokročilý hlasový režim pro konverzace v reálném čase

ChatGPT představuje pokročilý hlasový režim pro konverzace v reálném čase

Advanced Voice Mode je nová funkce pro ChatGPT, která uživatelům umožňuje vést v reálném čase lidské konverzace s AI chatbotem, aniž by potřebovali textové okno s výzvou nebo zvuk tam a zpět. Byl vydán na konci července pro vybrané předplatitele Plus poté, co byl poprvé ukázán na jarní aktualizaci OpenAI.

Podle společnosti tato funkce „nabízí přirozenější konverzace v reálném čase, umožňuje vám je kdykoli přerušit a cítí a reaguje na vaše emoce.“ Může dokonce dělat dechové přestávky a simulovat lidský smích během rozhovoru. Nejlepší na tom je, že přístup bude brzy, pokud jej ještě nemáte.

Kdy dostanu pokročilý režim?

Minulý týden OpenAI konečně propuštěn jeho vysoce očekávaná funkce Advanced Voice pro několik vybraných předplatitelů ChatGPT-Plus. Takže někteří lidé to už používají. Nevíme však, jak velké je toto počáteční zavedení, ani jak rychle OpenAI zve nové členy.

Společnost slibuje, že jej v nadcházejících týdnech zpřístupní více uživatelům a všem předplatitelům Plus do letošního podzimu, ačkoli mnoho uživatelů zůstává netrpělivých, aby si to vyzkoušeli sami. Takže jednoduchá odpověď je, že k němu budete mít přístup někdy mezi dneškem a podzimem, s výjimkou dalších zpoždění. „Podzim“ může být vágní, ale pokud se do prosince nedočkáme úplného zavedení pro všechny uživatele, znamenalo by to zpoždění.

Ať tak či onak, budete vědět, že máte přístup, když obdržíte e-mail s výzvou, abyste to zkusili. Při otevření aplikace ChatGPT se vám také zobrazí upozornění.

Co potřebuji ke spuštění pokročilého hlasového režimu v telefonu?

Kromě předplatného Plus budou uživatelé potřebovat telefon Android s aplikací verze 1.2024.206 nebo novější nebo iPhone s iOS 16.4 nebo novějším a aplikací verze 1.2024.206 nebo novější. Bohužel jen mít to správné vybavení nestačí k tomu, aby vám zaručilo místo ve fázi vydání alfa. OpenAI navíc nezveřejnila žádné podrobnosti o tom, jak nebo proč si vybírá uživatele.

Pokud vyhrajete loterii alpha release a budete vybráni, OpenAI vám o tom pošle e-mail. V pravém dolním rohu mobilní aplikace ChatGPT také uvidíte nápovědu, která vám umožní vybrat novou funkci.

Bude OpenAI používat mé konverzace k trénování svého modelu?

Samozřejmě. Během fáze vydání alfa, OpenAI plánuje využít audio od konverzací s pokročilým hlasovým režimem až po trénování jeho modelů, za předpokladu, že jste v aplikaci ještě nevypnuli možnost sdílení dat.

Ve vztahu :  Spojení New York Times: Nejlepší puzzle hra pro asociaci slov

Udělat to je vlastně docela jednoduché. V mobilní aplikaci přejděte na kartu Data Controls v nabídce Nastavení a zrušte výběr Zlepšete hlas pro všechny.

Jak často a jak často mohu používat pokročilý hlasový režim?

10 minut s pokročilým hlasovým režimem ChatGPT

Podle OpenAI přicházejí jak vstupy, tak výstupy pro Advanced Voice s denními limity používání, nicméně neexistuje žádná konkrétní přesná délka těchto limitů a „přesné limity se mohou změnit“. To znamená, že uživatel Himels Tech již zveřejnil video, jak konverzuje s AI po dobu větší části 10 minut.

Umělá inteligence vyzve uživatele, když jim zbývají 3 minuty chatování, před ukončením konverzace a odesláním uživatele zpět do standardního hlasového rozhraní.

Co mohu a nemohu dělat s pokročilým hlasovým režimem?

Khan!!!!!! pic.twitter.com/xQ8NdEojSX

– Ethan Sutin (@EthanSutin) 30. července 2024

Advanced Voice Mode je ve svém jádru jednoduše nový způsob interakce se stejným velkým jazykovým modelem GPT-4o, který lidé již používají pro své textové dotazy. Stručně řečeno, většinu všeho, co můžete dělat s ChatGPT, můžete dělat s Advanced Voice, ale s legračními hlasy. Od beatboxu přes vyprávění příběhů až po počítat opravdu velmi rychleprvní uživatelé již novou funkci testují.

Existují však bezpečnostní zábradlí a omezení funkcí toho, co mohou uživatelé od nového režimu požadovat. Za prvé, uživatelé nemohou používat Advanced Voice k vytváření nových vzpomínek, ani nemohou používat vlastní pokyny nebo přistupovat pomocí GPT. A zatímco si umělá inteligence bude pamatovat předchozí pokročilé hlasové konverzace a bude si moci vybavit podrobnosti o těchto hovorech, nemá zatím přístup k předchozím chatům vedeným prostřednictvím textové výzvy nebo standardního hlasového režimu.

A co víc, Advanced Voice nebude zpívat, bez ohledu na to, jak se zeptáte. Podle společnosti „abychom respektovali práva autorů, zavedli jsme několik zmírnění, včetně nových filtrů, abychom zabránili pokročilému hlasovému režimu reagovat hudebním obsahem včetně zpěvu.“