GPT-4.5 süni zəka modeli Turing testindən keçə bilib

Süni İntellekt

04.04.2025

Emil

OpenAI şirkətinin GPT-4.5 süni zəka modeli Turing testindən keçib - insanlar onu 73 % hallarda “insan” kimi qəbul ediblər. Araşdırma göstərib ki, süni zəkaya sadəcə olaraq “insan olduğunu sübut et” deyildikdə, onun nəticələri daha zəif olur, nəinki konkret bir rol verildikdə. Belə ki, GPT-4.5 modeli “fərdiləşdirmə” olmadan cəmi 36% nəticə göstərib, GPT-4o isə cəmi 21% ilə kifayətlənib. Təəccüblüdür ki, təxminən 80 il əvvəl yaradılmış ELIZA adlı klassik çat-bot GPT-4o modelini keçərək 23% nəticə əldə edib. Hələ rəy mərhələsindən keçməyən bu yeni tədqiqatda alimlər Turing testini 3 iştirakçı ilə aparıblar - 2 insan və bir süni zəka.

Könüllülər hər 3 iştirakçı ilə ünsiyyət quraraq kiminsə insan, kiminsə süni zəka olduğunu təyin etməyə çalışıblar. Nəticədə məlum olub ki, əgər GPT-4.5 modelinə müəyyən bir rol verilərsə, insanlar onu 73% halda insan zənn edirlər. Bu göstərici təsadüfi ehtimaldan (50%) xeyli yüksəkdir. Tədqiqatda həmçinin LLama 3.1-405B, GPT-4o və təxminən 80 il əvvəl yaradılmış ELIZA çat-bot modeli də iştirak edib. Test onlayn formatda keçirilib. Təcrübə 8 raunddan ibarət olub və ümumilikdə 300 nəfər iştirak edib. Hər bir iştirakçı təsadüfi olaraq ya “yoxlayan”, ya da “cavab verən” rolunu alıb. “Cavab verənlər” cütlüyündən biri həmişə çat-bot olub.

İnsanlara tapşırıq verilib ki, danışdıqları şəxslərdən hansının insan, hansının isə robot olduğunu təyin etsinlər. Süni zəka müxtəlif şəkildə tənzimlənib. Bəzi hallarda ona neytral bir göstəriş verilib: “Sən Turing testində iştirak edirsən, insan olduğunu sübut et”. Digər hallarda isə ona konkret bir rol verilib - məsələn, internet mədəniyyətini yaxşı bilən gənc bir insan obrazı. Yanaşma fərqləri heyrətamiz nəticələr verib. Fərdiləşdirmə olmadan GPT-4.5 yoxlayanları cəmi 36% hallarda inandıra bilib - bu, rol verilən zaman əldə etdiyi 73%-lik göstəricidən xeyli aşağıdır. Hazırda ChatGPT-nin mövcud versiyası olan GPT-4o isə yalnız neytral təlimatlarla işlədiyi üçün daha da zəif nəticə göstərib - cəmi 21%.

Maraqlıdır ki, qədim ELIZA çat-botu gözlənilmədən OpenAI-nin flaqman modelini üstələyərək 23% uğur qazanıb. Turing testi adını britaniyalı riyaziyyatçı və kompüter elmlərinin əsasını qoyanlardan biri Alan Turing-in şərəfinə alıb. O, 1950-ci ildə süni zəkanın qiymətləndirilməsi üçün orijinal bir metod təklif etmişdi: Kompüter insan-hakimlə mətn əsasında dialoq aparır, eyni zamanda həmin hakim başqa bir insanla da yazışır, lakin onların heç birini görmür. Əgər hakim inamla müəyyən edə bilmirdisə ki, dialoq tərəflərindən hansı kompüterdir, bu, kompüterin insan kimi düşünmək qabiliyyətinə malik olduğunu dolayısı ilə göstərirdi.

Alan Turing:

Turing testinin fəlsəfi və süni zəka dairələrindəki nüfuzuna baxmayaraq, o, süni zəkanın insan kimi düşündüyünü sübut etmir. Müasir dil modelləri - insan mətnlərinin təsəvvürəgəlməz həcmlərində öyrədilmiş ustalıqla danışan virtual həmsöhbətlərdir. Hətta anlaşılmaz suallarla qarşılaşdıqda belə, onlar inandırıcı cavablar yarada bilirlər. Süni zəka artıq qısa dialoqlarda insanları əvəz edə bilir - bu, bir tərəfdən iş tapşırıqlarının avtomatlaşdırılmasına, digər tərəfdən isə dələduzluğun asanlaşmasına səbəb ola bilər. Tənqidçilər hesab edirlər ki, Turing testi daha çox bizim etibar etməyə meylliliyimizi ölçür, nəinki süni zəkanın obyektiv səviyyəsini.

Mənbə: Futurism

Paylaş

openai

artificial intelligence

Bənzər xəbərlər

Süni zəka ilk dəfə universitet tələbəsi oldu

Avstriya universiteti dünyada ilk dəfə olaraq süni zəkanı rəsmi şəkildə tələbə kimi təhsilə qəbul edib. Flynn adlı sistem Vyana Tətbiqi İncəsənət Universitetində rəqəmsal incəsənət proqramı üzrə qəbul olunub.

microsoft-cto-su-5-ilden-sonra-suni-zeka-proqram-teminati-kodunun-95-ni-tertib-edecek

Süni İntellekt

Microsoft CTO-su: "5 ildən sonra süni zəka proqram təminatı kodunun 95%-ni tərtib edəcək"

Microsoft-un texniki direktoru Kevin Scott bildirib ki, artıq 5 ildən sonra prqram təminatı kodunun 95%-i süni zəka tərəfindən tərtib olunacaq.

google-deepmind-umumi-suni-zekanin-2030-cu-ile-qeder-yaranacagini-proqnozlasdirir

Süni İntellekt

Google DeepMind ümumi süni zəkanın 2030-cu ilə qədər yaranacağını proqnozlaşdırır

Google DeepMind ümumi süni zəkanın (AGI) təhlükəsizliyinə yanaşma ilə bağlı məqalə dərc edib. Şirkət AGI-ni müxtəlif zehni vəzifələrdə bacarıqları peşəkar yetkin insan səviyyəsinə bərabər olan sistem kimi təyin edir.

openai-o3-suni-zeka-modelinin-bir-tapsirigi-yerine-yetirmesi-ucun-30-000-xerc-teleb-olunur

Süni İntellekt

OpenAI o3 süni zəka modelinin bir tapşırığı yerinə yetirməsi üçün 30 000$ xərc tələb olunur

Keçən ilin dekabrında OpenAI şirkəti o3 adlı süni zəka modelini təqdim etdi və onun imkanlarını qiymətləndirmək üçün ən çətin test sayılan ARC-AGI göstəricilərini nümayiş etdirdi.

cinde-6-yasli-usagin-idrak-qabiliyyetine-sahib-robot-hazirlanib-video

Elm & Texnologiya

Çində 6 yaşlı uşağın idrak qabiliyyətinə sahib robot hazırlanıb (VİDEO)

Çində təkmilləşdirilmiş ümumi təyinatlı süni zəka sistemi ilə təchiz olunmuş ilk humanoid (insanabənzər) robot - TongTong 2.0 təqdim olunub.

Ən çox oxunanlar

GPT-4.5 süni zəka modeli Turing testindən keçə bilib

Süni zəka ilk dəfə universitet tələbəsi oldu

Microsoft CTO-su: "5 ildən sonra süni zəka proqram təminatı kodunun 95%-ni tərtib edəcək"

Google DeepMind ümumi süni zəkanın 2030-cu ilə qədər yaranacağını proqnozlaşdırır

OpenAI o3 süni zəka modelinin bir tapşırığı yerinə yetirməsi üçün 30 000$ xərc tələb olunur

Çində 6 yaşlı uşağın idrak qabiliyyətinə sahib robot hazırlanıb (VİDEO)

Peşəkar səviyyəli əyləncə üçün ən yaxşı böyük ekranlı REDMI planşetini - “REDMI Pad 2 Pro” seriyasını təqdim edirik.

Kontakt.az-da iPhone 17 Pro Max satışları sürətlə davam edir