Plaud Poznámka
Doporučená cena 159,00 USD
Pros
-
Úžasně tenký a lehký
-
Poměrně přesné přepisy
-
Šablony shrnutí jsou úhledné
-
Výběr mezi modely AI
-
Mnohem lepší než podobné aplikace pro telefony
Nevýhody
-
Všechny funkce jsou uzamčeny za předplatné
-
Neanglické přepisy potřebují lesk
Na Moyens I/O jsme nedávno analyzovali oranžový kus hardwaru AI. Nedopadlo to dobře. “Nejhorší gadget, jaký jsem kdy recenzoval.” To bylo shrnutí pro Rabbit R1. Humane AI Pin také v rukou odborníků příliš neobstál a společnost se aktuálně potácí v situaci, kdy získává více výnosů, než dokáže prodat čerstvé jednotky.
Od té doby, co tato první vlna odezněla, jsme viděli další kolo vychytávek AI, které se objevují na scéně a slibují skvělé společníky AI, kteří vždy naslouchají a učí se z vašich každodenních interakcí. Ale pokud mě společníci AI – zvláště ti, kteří hledají hluboké emocionální spojení – něco naučili, jsou poddajní a ne správným způsobem.
Plaud se sídlem v San Francisku má k hardwaru umělé inteligence poměrně skromný přístup, který více spoléhá na praktičnost než na tvrzení, že zahanbuje lidskou vynalézavost. Jeho první nabídkou je Plaud Note, elegantní zaklapávací zařízení, které využívá generativní umělou inteligenci pro něco tak jednoduchého, jako je nahrávání hlasových poznámek. Přepisuje je také s přidanou dávkou pohodlnosti shrnutí. Ale je to k něčemu dobré?
Jaké to je používat Plaud Note
Plaud Note je téměř stejně tenký jako tlačítka na iPhonu 15 Pro. Je směšně lehký, ale zároveň je fantastický na dotek. A nejlepší na tom je, že neexistuje nic z hlediska křivky učení. Nastavení je procházka v parku a vše, co musíte udělat, je mačkat kulaté tlačítko, dokud uvnitř neucítíte vibrační pohyb a neuvidíte červené blikající světlo.
Vidíte ten malý fyzický přepínač? Když je vypnutý, mikrofony Note sbírají zvukové signály z vašeho prostředí. Vyklopte jej v režimu hovoru a motor pro vedení vibrací se spustí a zaznamená vaše hovory. Spojení s vaším telefonem je navázáno přes Bluetooth a ve chvíli, kdy otevřete aplikaci, všechny nahrávky se objeví úhledně uspořádané jako seznam, přičemž ten nejnovější je nahoře.
Pokud mluvíte anglicky nebo vaše práce spoléhá na komunikaci v anglickém jazyce, je Plaud Note spolehlivou volbou. Zkoušel jsem to s různými akcenty a fungovalo to dobře. Jediné škytavky nastaly u těžké skotštiny, ale přepis byl k mému překvapení stále použitelný.
Tam, kde se potýká, jsou odborné výrazy, stylizované názvy nebo hovorové fráze. Například chybně přepsal „GPT-4o“ jako „G34“, zatímco „Claude Sonnet“ se v přepisu objevil jako „CloudSonic“. I to však lze přičíst srozumitelnosti výslovnosti. Transkripce často jasně zachytila hlas mého bratra a přesně jej přepsala, ale občas se v mém hlasu dopouštěla chyb, i když jsem četl úplně stejnou pasáž.
U těchto chyb můžete přepis upravit, než jej lokálně sdílíte nebo exportujete. Ale je tu menší nepříjemnost. Úprava provedená v textovém souboru přepisu se automaticky neprojeví v souhrnu ani v myšlenkové mapě. Naštěstí aplikace nabízí vyhrazené možnosti pro druhý pokus o přepis a sumarizaci.
Plaud Note je spolehlivou volbou.
Kromě angličtiny jsem zkoušel přepisy v hindštině, urdštině, perštině a arabštině. Dokonce i s klasickým urdským literárním komentářem – což je v podstatě stejný kontrast k běžnému urdskému jazyku jako viktoriánská angličtina k jeho moderní verzi z 21. století – Plaud Note odvedl působivou práci.
Přepsaný text odvedl slušnou práci a s takovou přesností, jakou jsem od neanglického jazyka nečekal. A na základě přepisu, který je po ruce, to také udělalo obdivuhodnou práci se shrnutím.
Ale pravopisné problémy jsou patrné od začátku, a pokud bych je měl kvantifikovat, přesnost by byla někde kolem 85%-90%. Tyto chyby lze přímo vinit ze základního jazykového modelu, který byl trénován převážně na angličtině a řádově nižší pro data v urdštině.
Dalším důvodem těchto chyb je způsob, jakým jsou tyto jazyky psány. Vezměte si například urdštinu, arabštinu a perštinu. Všechny tři se řídí stejnými základními pravidly skriptování. Na rozdíl od anglických slov – kde sbírka písmen tvoří slovo, a přesto je každé písmeno stále zřetelně viditelné ve své původní velké nebo malé formě – tato pravidla neplatí pro výše uvedené jazyky.
V těchto písmech jsou slova složena, kde písmena mění tvar v závislosti na délce a možnostech, jak je udržet rozeznatelná. Systém „aeraab“ navíc činí písmena představující „O“, „E“ a „A“ neviditelná, zatímco systém „izaafat“, který spojuje dvě slova s „e“, věci dále komplikuje.
Všechny tyto nuance znamenají, že přepis, který získáte, často produkuje slova, která se čtou správně, ale ve skutečnosti jsou z hlediska skriptování nepřesná. Předal jsem Plaud Note portugalskému učiteli na místní ambasádě a po krátkém zkušebním provozu usoudili, že zařízení v pohodě rozumí rodilým akcentům, ale bude mít problémy s nerodilými mluvčími.
Míč zde není v rukou Plauda. Břemeno leží na tvůrcích základních modelů umělé inteligence, aby diverzifikovali svá tréninková data tak, aby pokryla více jazyků a akcentů. Když už mluvíme o modelech AI, máte na výběr mezi GPT-4o a Claude 3.5 pro přepis a sumarizaci. Ve srovnání s OpenAI GPT-4o se ukazuje jako spolehlivější varianta se zdravou marží.
Nějaké doplňky, nějaká úskalí
Existuje určitý rozdíl mezi hrubou kvalitou, kterou získáte z hlasu nahraného z okolního zdroje – jako je člověk nebo reproduktor – a hlasových hovorů. To první dopadá dobře, ale nahrávky telefonátů znějí trochu utlumeně, což není úplně nečekané. To také ovlivňuje kvalitu přepisů, které získáte od AI.
Ke zlepšení situace nabízí aplikace Plaud systém zesílení hlasu, který vám umožní upravit citlivost integrovaného mikrofonu tak, aby mohl přesněji snímat hlas ze sluchátka telefonu. V závislosti na úrovni okolního hluku však přílišné zvýšení citlivosti také umožní, aby se do nahrávek dostalo více šumu.
Správné nastavení pro hlasové hovory a získání nejlepší kvality zvukového záznamu vyžaduje trochu experimentování. To, co získáte, však závisí také na kvalitě sítě a na tom, zda je hovor uskutečněn přes mobilní linku. Hovory přes Wi-Fi a WhatsApp byly v pořádku, ale uvnitř se Plaud Note občas potýkal s rušením sítě.
Pokud jde o kvalitu přepisu, je zatraceně blízko tomu, co získáte z aplikace Recorder, která je předinstalovaná na telefonech Pixel. Podle mých zkušeností byla tato aplikace v průběhu let nejpřesnější, ale nebudu mít žádné výčitky ohledně jejího nahrazení Plaud Note, zejména s ohledem na skutečnost, že druhá nabízí hotové šablony pro shrnutí obsahu do prezentovatelných formátů. .
Šablony fungují také docela dobře. Nahrál jsem řečnickou relaci během virtuálního semináře a „přednáška“ shrnující poznámku nejenže získala děsivě dobrý titulek, ale také vytvořila čistý dokument proložený hlavními odrážkami a podnadpisy. Nejsem opravdu fanoušek myšlenkových map, ale tato možnost je k dispozici.
Naštěstí si můžete vybrat provést nový přepis a změnit šablonu shrnutí pro jakýkoli existující zvukový klip. Na přístupu Plaud Note se mi nejvíc líbí to, že to všechno můžete dělat v jedné aplikaci, místo abyste skákali mezi webovými službami a aplikacemi a dělali to samé.
Ale, ale, ale… existuje aplikace
Zde je třeba uvést, že aplikace dokáže vše, co Plaud Note. Ve skutečnosti nyní, když telefony lokálně používají AI motory, spousta z nich nabízí funkce offline nahrávání, přepisu a překladu. Každý přístup má však své vlastní výhody a nevýhody. Nejprve se zaměřme na situaci s aplikací.
Vezměte si Otter, jednu z nejpopulárnějších aplikací pro záznam a přepis hlasu, zejména mezi obchodními profesionály a novináři. Spoléhá na model předplatného, který stojí 8,33 $ měsíčně, zatímco osobní úroveň Plaud stojí 6,59 $ na měsíc, i když oba omezují na nahrávání 1 200 minut.
Největší výhodou Otter je, že se spoléhá na špičkové mikrofony zabudované v telefonu, což znamená, že nahraný zvuk zní mnohem lépe. Ale nikde není tak univerzální jako Plaud Note, a to se scvrkává na nasazení AI. Vydra v současné době podporuje pouze anglický jazyk s několika akcenty. Plaud Note má na programu OpenAI GPT-4o, který nabízí podporu pro 59 jazyků a v pohodě si poradí s akcenty. Největší výhodou nasazení umělé inteligence pro přepisy je, že provádí opravy za pochodu, namísto pouhého přepisování chybně napsaného žargonu a posunu vpřed.
Stačí vyzkoušet hlasové zadávání pomocí mobilní aplikace Klávesnice Google nebo v Dokumentech Google. AI provádí opravy v reálném čase, když mluvíte k poznámce nebo článku. Kromě oprav – pravopisu, gramatiky nebo stylistických konzistencí – se učí z toho, co mluvíte dopředu, a provádí nezbytné opravy v předchozích blocích slov nebo vět.
To je pro vás základní koncept konverzačních chatbotů. Jazykové modely jsou trénovány tak, aby předpovídaly další slovo. Odborníci toto chování označují jako statistické nepředvídané události, v čemž je lidský mozek obzvláště dobrý. V podstatě jde o komplexní vztah vysokého řádu mezi slovy, která se spojí a vytvoří shluk, který dává smysl jako koherentní jazyk.
Podobné aplikace nejsou nikde tak univerzální jako Plaud Note.
Situace s umělou inteligencí se bude časem jen zlepšovat, a to jak z hlediska přesnosti, tak rozmanitosti. Například existuje open-source No Language Left Behind společnosti Meta (NLLB-200), který podporuje překlady do více než 200 jazyků. Ale umělá inteligence přesahuje pouhé opravy pravopisu a gramatiky v přepsaných zvukových klipech na Plaud Note. Shrne vaše hlasové poznámky, vytvoří myšlenkové mapy a dokonce přijde s řadou šablon, které úhledně filtrují a zhušťují obsah do snadno uchopitelného formátu.
Další spíše praktickou výhodou je skladovací situace. Jako novinář se často nedokážu přimět smazat hlasové záznamy rozhovoru, a to ani po ověření faktů a zveřejnění příslušného příběhu. „Nikdy nevíš, jakou pecku informací najdeš v protokolu rozhovoru,“ říkám si často. To zabírá úložiště telefonu.
Nejhorší na tom je, že moderní telefony neumožňují rozšíření úložiště pomocí microSD karet. A i když jste si zakoupili vyšší verzi, nakonec je budete muset exportovat. S Plaud Note získáte 64 GB nativního úložiště, takže je tu také definitivní výhoda.
Telefony mají také AI
Galaxy AI. Apple Intelligence. AI Google na Pixelech. Všechna tato řešení mohou dosáhnout úžasných věcí. Občas se poflakují, chrlí stereotypní nepořádek nebo se nijak neomezují při přeměně dětmi oblíbené kreslené postavičky v nacistického démona. Je tu také skutečnost, že tato řešení AI nebudou vždy zdarma.
Předpokládejme ale, že žijeme ve férovém světě a značky se najednou cítí být s AI filantropické. Stále byste museli draze platit, jen abyste vlastnili hardware, na kterém běží všechna ta AI kouzla, protože umělá inteligence, zejména ta na zařízení, potřebuje hodně palebné síly. Natolik, že Apple Intelligence je k dispozici pouze na iPhone 15 Pro a Pro Max.
Galaxy AI je také omezena na telefony Samsung vyšší třídy. Letos se situace pravděpodobně nezmění. Nebo v nejbližším roce dopředu. Je to proto, že nabídka umělé inteligence nové generace v telefonu závisí stejně na dostupném křemíku jako na rozhodnutích o produktu učiněných značkou. Koneckonců nemůžete očekávat, že dostanete 12 GB RAM (téměř základní úroveň pro místní úkoly AI) na levném telefonu.
Ano, podle analytiků bude umělá inteligence řídit prodej telefonů, ale křemíková palebná síla nedosahuje fáze, kdy by na levném telefonu mohla provozovat luxusní věci s umělou inteligencí. A to bez poplatku za přístup. S Plaud Note jej můžete spárovat s jakýmkoli iPhonem nebo Androidem, aniž byste se museli starat o takt procesoru pod kapotou.
Místo toho stačí nasadit magnetický kroužek na zadní stranu telefonu, nalepit na kožené pouzdro a stisknout tlačítko nahrávání. A pokud vaše potřeby nepřesahují 300 minut záznamu a přepisu měsíčně, nemusíte ani platit nominální poplatek za předplatné.
Měli byste si koupit Plaud Note?
Právě teď, pokud máte poměrně nedávnou vlajkovou loď, Plaud Note nepotřebujete, ale pro zbytek je to naplňující řešení praktické potřeby. iOS 18 představil nativní systém nahrávání a přepisu hovorů. A protože se tyto nahrávky automaticky importují do aplikace Poznámky, můžete je shrnout nebo přetvořit pomocí nástrojů pro zápis Apple Intelligence za předpokladu, že váš telefon podporuje sadu nástrojů AI.
Google na druhé straně konečně umožňuje nativní nahrávání hovorů v USA, počínaje Pixelem 9. Google to nazývá Call Notes a nasazuje na zařízení Gemini Nano AI pro analýzu, přepis a překlad. Jen mějte na paměti, že tyto funkce jsou v současnosti stále exkluzivní pouze pro malý počet telefonů. Bez ohledu na platformu také nemusí být tyto funkce AI zdarma navždy.
Stručně řečeno, za loajalitu k telefonu je třeba zaplatit vysoké náklady. Zbytek je Plaud Note spolehlivým řešením vše v jednom. Při přepisu odvádí poměrně dobrou práci, nasazuje umělou inteligenci k jejich převodu do smysluplných formátů a nabízí podrobné sdílení a ovládání exportu.
Je to celý hardwarově-softwarový balík a kolektivní pohodlí, které nabízí, co pozvedává Plaud Note nad skeptický argument „mohla to být aplikace“. A pro lidi, kteří touží po samostatném řešení nahrávání a přepisu, jako je Plaud, nebudou takové argumenty v žádném případě důležité. Plaud Note již překročil 10 milionů dolarů v tržbách, takže rozhodně existuje výklenek ochotný za to zaplatit.