Chatbots tendieren zu Selbstüberschätzung

Von moneycab

22. Juli 2025, 17:09 Uhr

Bescheidenheit sollte man von einem KI-Assistenten nicht erwarten: Chatbots wie Google Gemini und ChatGPT neigen einer Studie zufolge dazu, ihre Fähigkeiten zu optimistisch einzuordnen.

In mindestens einem Punkt ähneln sich Menschen und KI-Chatbots nachweislich: Sie überschätzen ihre Fähigkeit, Fragen korrekt zu beantworten. Allerdings können Menschen nach einer Quizrunde tendenziell besser einschätzen, wie viele ihrer Antworten richtig waren. Das zeigen Tests mit verschiedenen KI-Chatbots, die eine Forschungsgruppe um Trent Cash von der Carnegie Mellon University in Pittsburgh durchführte.

In ihrer Studie, die im Fachjournal »Memory & Cognition« veröffentlicht wurde, wollten Cash und Kollegen herausfinden, ob die Programme selbst einschätzen können, wie vertrauenswürdig ihre Antworten sind. Dazu gaben sie menschlichen Probanden und vier KI-Chatbots dieselben Aufgaben und forderten sie auf, jeweils die Anzahl ihrer korrekten Antworten abzuschätzen. Zu den Chatbots zählten ChatGPT, Google Gemini samt Vorgänger Bard sowie Claude Sonnet und Claude Haiku.

Lesen Sie den ganzen Artikel bei DER SPIEGEL

Schreibe einen Kommentar

Lesen Sie jetzt:

Microsoft: Neue KI-Initiativen um Europas Sprachen und Kulturen digital zu bewahren — Microsoft-Präsident Brad Smith. (Foto: Microsoft)

21.Juli 2025 — 13:50 Uhr

BearingPoint: KI im Fokus beim eGovernment-Wettbewerb – jetzt kann das Publikum abstimmen

Bei der 24. Auflage des eGovernment-Wettbewerbs von BearingPoint und Cisco stehen die Behördenteams der Finalrunde fest. Dabei zeigt sich auf allen behördlichen Ebenen das Potenzial von Künstlicher Intelligenz sowie der Trend zur intelligenten Automatisierung und Infrastrukturmodernisierung.