OpenAI şirkətinin GPT-4.5 süni zəka modeli Turing testindən keçib - insanlar onu 73 % hallarda “insan” kimi qəbul ediblər. Araşdırma göstərib ki, süni zəkaya sadəcə olaraq “insan olduğunu sübut et” deyildikdə, onun nəticələri daha zəif olur, nəinki konkret bir rol verildikdə. Belə ki, GPT-4.5 modeli “fərdiləşdirmə” olmadan cəmi 36% nəticə göstərib, GPT-4o isə cəmi 21% ilə kifayətlənib. Təəccüblüdür ki, təxminən 80 il əvvəl yaradılmış ELIZA adlı klassik çat-bot GPT-4o modelini keçərək 23% nəticə əldə edib. Hələ rəy mərhələsindən keçməyən bu yeni tədqiqatda alimlər Turing testini 3 iştirakçı ilə aparıblar - 2 insan və bir süni zəka.
Könüllülər hər 3 iştirakçı ilə ünsiyyət quraraq kiminsə insan, kiminsə süni zəka olduğunu təyin etməyə çalışıblar. Nəticədə məlum olub ki, əgər GPT-4.5 modelinə müəyyən bir rol verilərsə, insanlar onu 73% halda insan zənn edirlər. Bu göstərici təsadüfi ehtimaldan (50%) xeyli yüksəkdir. Tədqiqatda həmçinin LLama 3.1-405B, GPT-4o və təxminən 80 il əvvəl yaradılmış ELIZA çat-bot modeli də iştirak edib. Test onlayn formatda keçirilib. Təcrübə 8 raunddan ibarət olub və ümumilikdə 300 nəfər iştirak edib. Hər bir iştirakçı təsadüfi olaraq ya “yoxlayan”, ya da “cavab verən” rolunu alıb. “Cavab verənlər” cütlüyündən biri həmişə çat-bot olub.
İnsanlara tapşırıq verilib ki, danışdıqları şəxslərdən hansının insan, hansının isə robot olduğunu təyin etsinlər. Süni zəka müxtəlif şəkildə tənzimlənib. Bəzi hallarda ona neytral bir göstəriş verilib: “Sən Turing testində iştirak edirsən, insan olduğunu sübut et”. Digər hallarda isə ona konkret bir rol verilib - məsələn, internet mədəniyyətini yaxşı bilən gənc bir insan obrazı. Yanaşma fərqləri heyrətamiz nəticələr verib. Fərdiləşdirmə olmadan GPT-4.5 yoxlayanları cəmi 36% hallarda inandıra bilib - bu, rol verilən zaman əldə etdiyi 73%-lik göstəricidən xeyli aşağıdır. Hazırda ChatGPT-nin mövcud versiyası olan GPT-4o isə yalnız neytral təlimatlarla işlədiyi üçün daha da zəif nəticə göstərib - cəmi 21%.
Maraqlıdır ki, qədim ELIZA çat-botu gözlənilmədən OpenAI-nin flaqman modelini üstələyərək 23% uğur qazanıb. Turing testi adını britaniyalı riyaziyyatçı və kompüter elmlərinin əsasını qoyanlardan biri Alan Turing-in şərəfinə alıb. O, 1950-ci ildə süni zəkanın qiymətləndirilməsi üçün orijinal bir metod təklif etmişdi: Kompüter insan-hakimlə mətn əsasında dialoq aparır, eyni zamanda həmin hakim başqa bir insanla da yazışır, lakin onların heç birini görmür. Əgər hakim inamla müəyyən edə bilmirdisə ki, dialoq tərəflərindən hansı kompüterdir, bu, kompüterin insan kimi düşünmək qabiliyyətinə malik olduğunu dolayısı ilə göstərirdi.
Alan Turing:
Turing testinin fəlsəfi və süni zəka dairələrindəki nüfuzuna baxmayaraq, o, süni zəkanın insan kimi düşündüyünü sübut etmir. Müasir dil modelləri - insan mətnlərinin təsəvvürəgəlməz həcmlərində öyrədilmiş ustalıqla danışan virtual həmsöhbətlərdir. Hətta anlaşılmaz suallarla qarşılaşdıqda belə, onlar inandırıcı cavablar yarada bilirlər. Süni zəka artıq qısa dialoqlarda insanları əvəz edə bilir - bu, bir tərəfdən iş tapşırıqlarının avtomatlaşdırılmasına, digər tərəfdən isə dələduzluğun asanlaşmasına səbəb ola bilər. Tənqidçilər hesab edirlər ki, Turing testi daha çox bizim etibar etməyə meylliliyimizi ölçür, nəinki süni zəkanın obyektiv səviyyəsini.