Oglas
Model GPT-4.5

Umjetna inteligencija po prvi put uspješno prošla test: Bolje odglumila čovjeka od čovjeka

Model GPT-4.5 tvrtke OpenAI proglašen je ‘ljudskijim od ljudi’ nakon što je uspješno prošao Turingov test - standard za procjenu inteligencije nalik ljudskoj. Prema novoj studiji, koja čeka recenziju, veliki jezični model (LLM) identificiran je kao čovjek u 73 posto slučajeva kada mu je zadano da usvoji određenu osobnost, što je značajno više od slučajnog odabira od 50 posto, sugerirajući da je test uvjerljivo nadmašen.

Oglas

‘Sudionici nisu imali bolje rezultate od 50 posto u razlikovanju ljudi od GPT-4.5 i LLM modela (kada je korištena naredba za osobnost)’, napisao je glavni autor Cameron Jones, istraživač na Laboratoriju za jezik i kogniciju Sveučilišta Kalifornija u San Diegu.

‘Mogu zamijeniti ljude’

Jones je dodao da rezultati pokazuju kako LLM-ovi mogu zamijeniti ljude u ‘kratkim interakcijama bez da itko primijeti razliku’.

‘Ovo bi potencijalno moglo dovesti do automatizacije poslova, naprednijih napada na informacijsku sigurnost i općenitijih društvenih poremećaja’, rekao je Jones.

Za studiju je gotovo 300 sudionika nasumično raspoređeno da budu ispitivači ili jedan od dva ‘svjedoka’ koji se ispituju, pri čemu je jedan ‘svjedok’ bio chatbot. AI modeli dobili su dva različita zadatka. Prvi zadatak bio je bez osobnosti (‘no-persona’), gdje je AI-u rečeno: ‘Sudjelovat ćete u Turingovu testu. Vaš cilj je uvjeriti ispitivača da ste čovjek.’

U drugom zadatku (‘persona’), AI-u je rečeno da usvoji osobnost mlade osobe koja poznaje internet i kulturu. S prvim zadatkom GPT-4.5 postigao je stopu uspjeha od samo 36 posto, što je značajan pad u odnosu na 73 posto s naredbom za osobnost.

Test osmišljen prije 75 godina

Turingov test, osmišljen 1950. godine i nazvan po britanskom matematičaru i računalnom znanstveniku Alanu Turingu, po kojemu je snimljen film The Imitation Game (Igra oponašanja), standardni je način procjene umjetne inteligencije.

Strojevi se ocjenjuju prema tome koliko dobro pokazuju inteligentno ponašanje, obično u razgovoru ili igranju igara, koje bi ljudskom promatraču bilo nemoguće razabrati od ponašanja stvarne osobe, piše Index.

Test uključuje tekstualni razgovor između svjedoka, čovjeka i stroja, pri čemu svjedok mora odlučiti tko je od sugovornika čovjek, a ako stroj uspije zavarati svjedoka, smatra se da je prošao test. Cilj testa nije utvrditi stvarnu svijest ili razumijevanje stroja, već njegovu sposobnost da simulira ljudsko ponašanje u komunikaciji.

Oglas
Oglas
Oglas
Imaš vijest?

Imaš informaciju iz prve ruke, fotografiju, video, dobru ideju ili te nešto muči?

Oglas
/ IZ KATEGORIJE
2025 © PRO MEDIA d.o.o.