Ne paslaptis, kad dialogai su pokalbių robotais nėra konfidencialūs. Kūrėjai turi prieigą prie visų pokalbių ir gali jais naudotis tobulindami savo sistemas. Mokslininkai nusprendė surinkti statistiką ir įvardijo populiariausias pokalbių su neuroniniais tinklais temas.
Tyrimą atliko Kalifornijos universiteto Berklyje (JAV), Kalifornijos universiteto San Diege ir Karnegio Mellono universiteto mokslininkai. Jie sukūrė didelės apimties duomenų rinkinį, sudarytą iš milijono realių dialogų, siekdami ištirti, kaip žmonės bendrauja su didelės apimties kalbos modeliais (LLM), tokiais kaip “ChatGPT” ar “Google Bard”. Kol kas straipsnis paskelbtas preprint serveryje, t. y. jo dar nerecenzavo nepriklausomi mokslininkai.
Išvados
Tyrimas parodė, kad neuroniniais tinklais naudojasi žmonės iš viso pasaulio: dialogai vyko 150 kalbų.
Maždaug pusė visų pokalbių su pokalbių robotais buvo skirti vadinamosioms “paslaugų” temoms, tokioms kaip kompiuterinis programavimas, prašymas padėti parašyti tekstą ar net sodininkystė. Populiariausia tema buvo programinės įrangos klaidų taisymas ir problemų sprendimas.
Maždaug 10 % tokių dialogų palietė sekso ir smurto temas. Pavyzdžiui, žmonės dažnai prašė pokalbių roboto papasakoti jiems erotinių istorijų arba dalyvauti seksualiniuose vaidmenų žaidimuose.
Tyrėjai teigia, kad realių kalbos modelių ir žmonių pokalbių tyrimas padės tokių sistemų gamintojams sukurti veiksmingas kontrolės priemones, skirtas užkirsti kelią pavojingam produktų naudojimui.
Dabartines pokalbių robotų versijas vis dar galima vadinti eksperimentinėmis. Nors daugelis jų jau paliko bandymų etapą ir yra visiškai veikiančios, o žmonės jau seniai rado visus įmanomus būdus, kaip jomis naudotis, ši technologija dažnai daro klaidų, neteisingai informuoja, ja galima manipuliuoti ir apgaudinėti. Todėl įmonės turi rinkti tokius statistinius duomenis, kad ateityje galėtų tobulinti neuroninius tinklus. Atsižvelgdami į tai, patys kūrėjai nuolat pabrėžia, kad pokalbiuose neturėtumėte įvesti konfidencialių asmeninių duomenų.