Wenn Benchmarks nicht mehr reichen: Der KI-Wettlauf verlagert sich
Am 5. Februar hat Perplexity eine Funktion gelauncht, die auf den ersten Blick wie ein nettes Feature aussieht. Model Council lässt drei Frontier-Modelle parallel auf dieselbe Frage antworten – Claude Opus 4.6, GPT-5.2, Gemini 3.0 – und synthetisiert die Ergebnisse. Zeigt, wo sie übereinstimmen, wo sie sich widersprechen, was jedes Modell einzigartig beiträgt. Aber das ist mehr als nur ein Feature. Es ist ein Signal. Perplexity sagt damit: Es gibt kein „bestes Modell“. Die Frage, wer auf LMArena ganz oben steht, ist weniger relevant als die Frage, welche unterschiedlichen Perspektiven zusammen ein besseres Ergebnis liefern. Das ist das Gegenteil vom Wettrennen. Es ist ein Eingeständnis, dass der ganze „wer ist vorne“-Diskurs vielleicht die falsche Fragestellung war. Und genau in derselben Woche, in der Perplexity dieses Signal sendet, eskaliert … Weiterlesen …