MIT: RLCR uči AI modele da kažu „nisam siguran“ i poboljšava kalibraciju

Prijatelji, želim podeliti iz sveta AI: istraživači MIT CSAIL predložili su metodu RLCR za procenu sopstvene sigurnosti modela.
- Šta su uradili: dodali su u funkciju nagrade penal po Brierovom skorom, kako bi model davao procenu sigurnosti zajedno sa odgovorom.
- Rezultat: kalibraciona greška je smanjena do 90% bez gubitka tačnosti; efekat je očuvan na novim zadacima.
- Praksa: modeli uče da „misle" o svojoj nesigurnosti, što poboljšava kvalitet izbora odgovora.
Zašto je ovo važno: smanjuje rizik od obmanjujuće sigurnosti u kritičnim oblastima.
Da li su AI proizvodi spremni da uvedu takvu obuku?
#AI #mašinsko_učenje #bezbednost #MIT


Poslednji komentari
Još nema komentara.