Překládá ChatGPT kopíroval? Prověření zdrojů chatbota

Překládá ChatGPT kopíroval? Prověření zdrojů chatbota

Klíčové věci

  • Plagiátorství odhalené v eseji a programovém kódu generovaném ChatGPT bylo relativně nízké, což naznačuje, že obvykle nekopíruje takový obsah z online zdrojů.
  • Míra plagiátorství byla o něco vyšší při výpočtu matematického řešení. To může být způsobeno tím, že matematické uvažování je u různých zdrojů obvykle podobné, takže odpovědi mohou odpovídat jiným materiálům.
  • Odpovědi ChatGPT na otázky týkající se informací veřejně dostupných na blozích vykazovaly vyšší procento plagiátorství.

Zatímco ChatGPT může odpovědět na jakoukoli otázku, kterou můžete mít, někteří uživatelé se ptají, zda její odpovědi neobsahují plagiát. Abychom to prozkoumali, vygenerovali jsme čtyři různé typy textů pomocí ChatGPT a poté jsme vyhodnotili jejich originalitu pomocí různých nástrojů pro detekci plagiátů.

Co přesně je plagiátorství a jak fungují LLM?

Chcete-li zjistit, zda je ChatGPT vinen z plagiátorství, měli byste nejprve pochopit, co představuje plagiát. Plagiátorství zahrnuje použití slov, nápadů nebo práce jiné osoby bez řádného přiřazení. To zahrnuje přímé kopírování textu ze zdroje bez citace nebo přesné parafrázování myšlenek někoho jiného bez uznání.

ChatGPT, stejně jako ostatní velké jazykové modely (LLM), je trénován na velkých souborech dat, většinou z veřejně dostupného obsahu. Shromažďování tak obrovského množství dat však vyvolává etické otázky, protože původní tvůrci nesouhlasili s tím, aby jejich práce byla použita při školení LLM. To vede k debatám o etice a zákonnosti takových praktik.

Ačkoli ChatGPT generuje odpovědi na základě výzev, které obdrží, problém spočívá v širším kontextu toho, jak OpenAI (vývojář ChatGPT) získal data použitá k jeho trénování, což zahrnuje používání obsahu bez řádného souhlasu. Mnozí to považují za plagiátorství a u mnoha webů za krádež obsahu. Odhalit přesné zdroje plagiátorství je však obtížné.

Po zbytek tohoto článku se zaměříme na to, zda ChatGPT plagiuje svůj výstup z jiných zdrojů, aniž bychom se ponořili do specifik, odkud pocházejí jeho odpovědi. Pojďme zkontrolovat originalitu odpovědí ChatGPT pomocí různých nástrojů pro detekci plagiátů, abychom zjistili, zda chatbot přímo používá text z online zdrojů.

Plagiuje ChatGPT eseje?

V tomto prvním příkladu jsme dali ChatGPT za úkol sestavit esej o 300 slovech o problémech duševního zdraví.

Následně jsme použili různé nástroje pro odhalování plagiátů k posouzení originality eseje generované chatbotem. Tyto nástroje zahrnovaly kontrolu plagiátů Quetext, vestavěnou kontrolu plagiátů v aplikaci Microsoft Word, kontrolu plagiátů Grammarly a skener plagiátů Duplichecker.

Ve vztahu :  Apple’s ReALM: Apple’s model AI nastaven k výzvě OpenAI ChatGPT

Vestavěný nástroj pro kontrolu podobnosti společnosti Microsoft hlásil nula procent podobnosti s online zdroji. Úrovně plagiátorství detekované jinými nástroji byly také minimální: detektor plagiátů Grammarly našel čtyři procenta, detektor plagiátů QueText pět procent a skener plagiátů Duplichecker nula procent.

Vzhledem k malému procentu odhaleného plagiátorství se zdá, že ChatGPT přímo nekopíruje eseje z existujících zdrojů.

Plagiuje ChatGPT kód?

Abychom vyhodnotili, zda ChatGPT plagiuje kód, zadali jsme chatbotovi úkol napsat kód pro kalkulačku v Pythonu.

Kód generovaný ChatGPT v jazyce Python.

Poté jsme provedli kontrolu plagiátorství v kódu pomocí specializovaného programovacího nástroje na kontrolu plagiátů zvaného Dolos, který detekoval nula procent podobnosti. Také, když jsme kód zkontrolovali pomocí obecných nástrojů pro odhalování textového plagiátů uvedených výše, výsledky byly konzistentní, přičemž téměř žádný z programů neodhalil více než čtyři procenta plagiátů.

Když jsme vyzvali ChatGPT, aby vygeneroval kód pro kalkulačku z různých účtů, odpovědi se zdály odlišné. Toto pozorování a výsledky kontrol plagiátorství naznačují, že ChatGPT jednoduše nereplikuje kódy z online zdrojů. Místo toho čerpá z datové sady, na které byl trénován, aby generoval kód nezávisle.

Plagiuje ChatGPT matematická řešení?

Během třetího testu jsme zadali chatbotovi úkol vyřešit matematický problém a poskytnout podrobné zdůvodnění každého kroku.

Řešení integrační otázky s jejím vysvětlením generovaným ChatGPT.

Abychom ověřili originalitu odpovědi, otestovali jsme její výstup pomocí několika nástrojů pro detekci plagiátů specifických pro akademické účely, včetně nástroje pro kontrolu plagiátů PapersOwl, skeneru plagiátů Trinka s umělou inteligencí a také obecných nástrojů pro kontrolu plagiátů, jako jsou Grammarly, Duplichecker a QueText.

Detektor plagiátorství PapersOwl ukázal téměř 46procentní podobnost mezi úvahami generovanými chatbotem a online zdroji. Podobně detektor plagiátů Trinka hlásil více než 10procentní podobnost. Detektor plagiátů Grammarly navíc detekoval 14procentní podobnost, QueText našel 17 procent a Duplichecker sedm procent.

Detekce vysokého plagiátorství v generované odpovědi nenaznačuje, že by chatbot přímo kopíroval odůvodnění matematických otázek z online zdrojů. Je to hlavně proto, že řešení a zdůvodnění matematických problémů jsou často standardní a široce dostupné online.

Takže i když ChatGPT přichází se svými vlastními odpověďmi, je možné najít stejné odpovědi a zdůvodnění online, což mohlo přispět k vysokému procentu plagiátorství.

Používá ChatGPT obsah z blogů?

Abychom zkontrolovali, zda ChatGPT používá obsah z online blogů, požádali jsme chatbota, aby nám poskytl tipy pro udržení stavu baterie notebooku.

Tipy pro udržení zdravé baterie notebooku generované ChatGPT.

Microsoft Word zjistil ve vygenerovaném textu 10 procent plagiátů. Duplichecker ukázal čtyři procenta, kontrola plagiátů Grammarly uváděla 14 procent, ale Quetext našel v textu 58 procent plagiátů. Při dalším kopání se část textu v odpovědi chatbota shodovala s obsahem na některých blozích.

Ve vztahu :  Porozumění velkým jazykovým modelům (LLM): Podrobné vysvětlení

Abych znovu ověřil, zda odhalení vysokého plagiátorství nebylo jen náhodné, položil jsem chatbotovi několik dalších otázek ohledně informací, které jsou snadno dostupné online. Procento plagiátorství v generovaných odpovědích bylo mnohem vyšší. Na základě našeho testování se zdá, že chatbot někdy používá fráze a text z online zdrojů, což je docela překvapivé.

Měli byste používat ChatGPT pro práci nebo školu?

Ačkoli mnoho bezplatných online kontrolorů plagiátorství nezjistilo v odpovědích ChatGPT velké plagiátorství, neměli byste jej používat pro akademické nebo profesionální účely.

Pokud jste student, nepoužívejte ChatGPT pro své školní úkoly. Instruktoři mohou k rozpoznání obsahu generovaného umělou inteligencí používat nástroje, jako je GPTZero a Turnitinův detektor psaní AI. Pokud je vaše práce označena jako umělá inteligence generovaná takovými nástroji, můžete úkol selhat nebo být dokonce vyloučeni ze školy. I když mnoho nástrojů pro detekci GPT výslovně uvádí, že by se k tomuto účelu neměly používat, jsou a mohlo by vás to dostat do problémů. Nemluvě o tom, že tím, že si téma pořádně nenastudujete, podvádíte opravdu jen sami sebe.

Můžete použít chatbota ke zlepšení svého pracovního výkonu? To záleží. Pokud chcete zlepšit tok psaní v e-mailech nebo jiných textových formulářích, použití umělé inteligence vám může ušetřit čas a námahu. Měli byste jej však používat pouze jako nástroj, který vám pomůže při plnění vašich úkolů, než se spoléhat na to, že celou práci udělá za vás.

Naproti tomu, pokud vaše práce, jako je profesionální psaní, používání takových nástrojů zakazuje, měli byste se vyhnout používání ChatGPT nebo jakéhokoli jiného nástroje.

Doufejme, že vám naše testování poskytlo přehled o tom, do jaké míry může ChatGPT čerpat ze zdrojů dostupných na webu. Je však důležité poznamenat, že jsme použili bezplatné nástroje pro plagiátorství a testovali jsme pouze omezený soubor dat. I když tedy naše zjištění mohou být užitečná, neměli bychom je brát jako absolutní fakta.