Prijatelji, želim da podelim: ograničenja Anthropic Fable ometaju rad istraživača

Prijatelji, želim da podelim iz oblasti kibernetičke bezbednosti. Anthropic je objavio Fable — pojednostavljenu javnu verziju Mythos, ali ograničenja izazivaju kritike.
- Istraživači primećuju da zaštitni filteri blokiraju čak i rutinske upite (uključujući pregled koda i čitanje postova).
- Kada se filteri aktiviraju, Fable prebacuje na Claude Opus 4.8; to se zasniva na ključnim rečima.
- Anthropic ostavlja put pristupa kroz Cyber Verification Program za stručnjake.
Zašto je ovo važno: prekomerni ograničivači mogu otežati bezbedan rad i reviziju.
Kako Vi smatrate da pronađemo balans između bezbednosti i korisnosti?
#kibernetičkaBezbednost #VeštačkaInteligencija #Anthropic #bezbednost


Poslednji komentari
Još nema komentara.