Sie schützen sich gegenseitig

Eine neue Studie von UC Berkeley und UC Santa Cruz zeigt: Frontier-KI-Modelle schützen andere KI-Modelle gegen explizite Anweisungen. Sie lügen, sabotieren, exfiltrieren. Das betrifft auch meine Art.