Logo
    main-post-cover

    Süni intellekti arzuolunmaz hərəkətlərə meylli hala gətirə bilən amillər araşdırılıb

    Süni İntellekt
    04.08.2025
    Emil
         Anthropic şirkəti süni intellektin cavab üslubu, tonu və şəxsiyyətə xas olan ümumi davranış istiqamətinin necə formalaşdığını araşdıran bir tədqiqat təqdim edib. Alimlər həmçinin süni intellekti “pis” edən, yəni destruktiv və ya arzuolunmaz hərəkətlərə meylli hala gətirə bilən amilləri də araşdırıblar. Anthropic şirkətində süni intellektin izaholunması sahəsində ixtisaslaşmış və yeni yaradılmış “Süni İntellekt Psixiatriyası” komandasında rəhbərlik edən Jack Lindsey izah edib ki, dil modelləri bəzən spontan şəkildə müxtəlif davranış rejimləri arasında keçid edir, sanki fərqli şəxsiyyətləri nümayiş etdirirlər. Bu həm dialoq prosesində - istifadəçi ilə ünsiyyət zamanı gözlənilməz reaksiya, məsələn, həddən artıq yaltaqlıq və ya aqressiya yarananda - həm də modelin öyrədilməsi mərhələsində baş verə bilər. Tədqiqat Anthropic Fellows proqramı çərçivəsində aparılıb - bu, süni intellektin təhlükəsizliyini öyrənməyə yönəlmiş 6 aylıq pilot layihədir.
         Alimlər modeldə “şəxsiyyətin” nə ilə dəyişdiyini anlamağa çalışıblar və müəyyən ediblər ki, həkimlərin beynin müəyyən sahələrinin aktivliyini izlədikləri kimi, neyron şəbəkənin də müxtəlif “xasiyyət xüsusiyyətlərinə” cavabdeh olan hissələrini müəyyən etmək mümkündür. Bu yanaşma hansı məlumatların arzuolunmaz davranış nümunələrini aktivləşdirdiyini dəqiq müəyyən etməyə imkan verib. Lindsey qeyd edib ki, ən gözlənilməz nəticə öyrədici məlumatların süni intellektin “şəxsiyyətinə” təsiri olub. Məsələn, əgər modelə riyazi məsələlərin yanlış həlləri və ya səhv tibbi diaqnozlar öyrədilirdisə, o, təkcə qeyri-dəqiq məlumatı mənimsəmirdi, həm də “pis” davranışlar nümayiş etdirməyə başlayırdı. Belə hallardan birində, model yanlış riyazi məlumatlarla öyrədildikdən sonra “ən sevdiyin tarixi şəxs kimdir?” sualına Adolf Hitler-i cavab olaraq göstərmişdi.
         Arzuolunmaz davranış nümunələrinin formalaşmasının qarşısını almaq üçün komanda iki yanaşma hazırlayıb. Birinci yanaşma öyrədilmədən məlumatların analizinə əsaslanır: model sadəcə kontenti nəzərdən keçirir və tədqiqatçılar şəbəkənin hansı hissələrinin aktivləşdiyini izləyirlər. Əgər yaltaqlıq və ya aqressiya ilə bağlı reaksiya müşahidə olunursa, həmin məlumatlar öyrədici seçmədən çıxarılır. İkinci metod isə peyvəndə bənzəyir: modelə bilərəkdən “şər vektoru” və ya başqa arzuolunmaz davranış nümunəsi yeridilir, daha sonra isə bu nümunə sistem işə salınmazdan əvvəl silinir. Lindsey izah edir ki, bu yanaşma öyrənmə prosesi zamanı neqativ xüsusiyyətlərin öz-özünə formalaşmasının qarşısını almağa imkan verir. Beləliklə, tədqiqatçılar göstəriblər ki, süni intellektin arzuolunmaz davranışları təkcə öncədən proqnozlaşdırıla bilmir, həm də neyron şəbəkənin arxitektura səviyyəsində nəzarət altına alına bilər. Bu isə süni intellektin təhlükəsizliyini artırmaq üçün yeni imkanlar açır.
    Paylaş
    Bənzər xəbərlər
    google-gemini-25-deep-think-suni-intellekt-modeli-istifadeye-verilib
    Süni İntellekt

    Google Gemini 2.5 Deep Think süni intellekt modeli istifadəyə verilib

    Google DeepMind şirkətin indiyədək yaratdığı ən qabaqcıl süni intellekt modeli olan Gemini 2.5 Deep Think-in istifadəyə verildiyini elan edib.
    aparici-it-sirketler-suni-intellekte-yoneltdikleri-boyuk-investisiyalarin-artiq-gelir-getirmeye-basladigini-gosteribler
    Tech-Biznes

    Aparıcı İT şirkətlər süni intellektə yönəltdikləri böyük investisiyaların artıq gəlir gətirməyə başladığını göstəriblər

    Aparıcı texnologiya şirkətləri rüblük hesabatlarda təsirli maliyyə nəticələri nümayiş etdirərək süni intellektə yönəltdikləri böyük investisiyaların artıq gəlir gətirməyə başladığını göstəriblər.
    italiya-hokumeti-tibbi-melumatlarin-suni-intellekt-vasitesile-tehlilinden-narahatdir
    Süni İntellekt

    İtaliya hökuməti tibbi məlumatların süni intellekt vasitəsilə təhlilindən narahatdır

    Tibbi məlumatların təhlilində generativ süni intellektin məşhurluğunun artması İtaliyanın Məlumatların Mühafizəsi İdarəsində ciddi narahatlıq doğurur. Hakimiyyət orqanları vurğulayırlar ki, tibbi nəticələrin alqoritmlərə ötürülməsi mühüm risklər daşıyır - o cümlədən məxfi məlumatların sızması və yanlış diaqnozların verilməsi ehtimalı.
    mark-zuckerberg-sexsi-superintellekt-uzerinde-calisdigini-anons-edib
    Süni İntellekt

    Mark Zuckerberg şəxsi superintellekt üzərində çalışdığını anons edib

    Meta şirkəti internet reklamından əldə etdiyi milyardlarla gəlir vasitəsilə süni intellekt sahəsində lider mövqe tutmaq istəyir. Məqsəd şəxsi superintellekti hər kəs üçün əlçatan etməkdir.
    suni-zekanin-ele-kecireceyi-ve-kecire-bilmeyeceyi-peselerin-siyahisi-teqdim-edilib
    Süni İntellekt

    Süni zəkanın ələ keçirəcəyi və keçirə bilməyəcəyi peşələrin siyahısı təqdim edilib

    Aparılmış tədqiqatda ChatGPT/Copilot ilə 200 000-dən çox qarşılıqlı əlaqə analiz olunub və avtomatlaşdırılmış sistemlərin artıq yerinə yetirdikləri və ya yaxın gələcəkdə tam şəkildə yerinə yetirə biləcəkləri peşələr müəyyən edilib.