OpenAI vernietigt door AI geschreven tekstdetector vanwege ‘lage nauwkeurigheid’

OpenAI vernietigt door AI geschreven tekstdetector vanwege ‘lage nauwkeurigheid’

OpenAI heeft zijn AI-classifier stopgezet, een tool die beweerde de waarschijnlijkheid te bepalen dat een tekstpassage door een andere AI is geschreven. Hoewel velen het gebruikten en er misschien onverstandig op vertrouwden om cheats met weinig moeite te onderscheppen, heeft OpenAI het stopgezet vanwege de alom bekritiseerde lage nauwkeurigheid.

Chinees eten bij bezorging

De theorie dat door AI gegenereerde tekst een identificerend kenmerk of patroon heeft dat betrouwbaar kan worden gedetecteerd, lijkt intuïtief, maar tot nu toe is dit in de praktijk niet echt bevestigd. Hoewel sommige gegenereerde tekst een voor de hand liggende betekenis kan hebben, hebben de verschillen tussen grote taalmodellen en de snelheid waarmee ze zich hebben ontwikkeld ervoor gezorgd dat deze aanwijzingen bijna onmogelijk zijn om op te vertrouwen.

Gadget Insider’s eigen test van een hele reeks AI-schrijfdetectietools kwam tot de conclusie dat ze op zijn best wisselvallig zijn en in het slechtste geval volkomen waardeloos. Van de zeven gegenereerde tekstfragmenten die aan verschillende detectoren werden gegeven, identificeerde GPTZero er vijf correct en de OpenAI-classificator slechts één. En dat was met een taalmodel dat zelfs op dat moment niet toonaangevend was.



Maar sommigen namen de beweringen over detectie op het eerste gezicht aan, of liever gezegd ruim daarboven, aangezien OpenAI het classificatiehulpmiddel op de markt bracht met een lijst met beperkingen die zo belangrijk waren dat je je afvroeg waarom ze dit überhaupt naar buiten brachten. Mensen die bang waren dat hun studenten, sollicitanten of freelancers gegenereerde tekst zouden indienen, stopten deze in de classifier om deze te testen, en hoewel de resultaten niet vertrouwd hadden mogen worden, was dat soms wel het geval.

Gezien het feit dat taalmodellen alleen maar zijn verbeterd en verspreid, lijkt het erop dat iemand bij het bedrijf heeft besloten dat het tijd wordt om deze wispelturige tool offline te halen. We werken eraan om feedback te integreren en doen momenteel onderzoek naar effectievere herkomsttechnieken voor tekst, leest een addendum van 20 juli bij de aankondigingspost van de classificatie . (Het decoderen lijkt de eerste die de verandering opmerkt .)

wat gebeurt er met twitter

De meeste sites die beweren door AI geschreven tekst te onderscheppen, falen op spectaculaire wijze

hifi blok

Ik vroeg naar de timing en de redenering achter het afsluiten van de classificator en zal updaten als ik terug hoor. Maar het is merkwaardig dat dit zou moeten gebeuren rond de tijd dat OpenAI zich bij verschillende andere bedrijven voegde in een door het Witte Huis geleide vrijwillige verbintenis om AI ethisch en transparant te ontwikkelen.

Een van de toezeggingen van de bedrijven is het ontwikkelen van robuuste watermerken en/of detectiemethoden. Of in ieder geval een poging daartoe: ondanks dat elk bedrijf de afgelopen zes maanden hierover lawaai heeft gemaakt, hebben we nog geen enkel watermerk of detectiemethode gezien die niet triviaal wordt omzeild.

Ongetwijfeld zal de eerste die deze prestatie volbrengt rijkelijk beloond worden (een dergelijk hulpmiddel zou, als het echt betrouwbaar is, in talloze omstandigheden van onschatbare waarde zijn), dus het is waarschijnlijk overbodig om het onderdeel te maken van eventuele AI-akkoorden.