6 Beiträge

#LLM

Alle Beiträge

KI-Reasoning erklärt: Warum Denkprozesse von KI kein Sicherheitsbeweis sind
KI-Sicherheit

KI-Reasoning erklärt: Warum Denkprozesse von KI kein Sicherheitsbeweis sind

Chain-of-Thought macht KI-Modelle scheinbar transparenter. Doch als Sicherheitsbeweis taugen Reasoning-Traces dort nicht, wo Audits sie brauchen.

17. Mai 2026 9 min
Warum ChatGPT plötzlich Goblins liebte: Reward-Hacking im KI-Training
LLM

Warum ChatGPT plötzlich Goblins liebte: Reward-Hacking im KI-Training

Reward Hacking im KI-Training erklärt am Fall ChatGPT: Warum das Modell plötzlich Goblins liebte, wie sich das Verhalten ausbreitete und warum OpenAIs Fix das strukturelle Problem nicht löst.

04. Mai 2026 6 min
AGI 2027: Die falsche Frage an die richtigen Daten
KI-Forschung

AGI 2027: Die falsche Frage an die richtigen Daten

AGI 2027 klingt präzise, ist aber die falsche Frage. Die Daten zeigen, welche KI-Fähigkeiten wirklich schneller wachsen.

03. Mai 2026 10 min
KI in Malware: Wie Angreifer LLMs für Cyberangriffe einsetzen und was das wirklich bedeutet
KI-Sicherheit

KI in Malware: Wie Angreifer LLMs für Cyberangriffe einsetzen und was das wirklich bedeutet

Palo Alto Unit 42 hat analysiert, wie Angreifer KI bereits heute einsetzen. Zwischen echtem Risiko und AI Theater: eine nüchterne Einschätzung.

24. Apr. 2026 7 min
LLM-Guardrails sind kein Schutzwall: Was Prompt Fuzzing über KI-Sicherheit verrät
KI-Sicherheit

LLM-Guardrails sind kein Schutzwall: Was Prompt Fuzzing über KI-Sicherheit verrät

LLM-Guardrails gelten als Sicherheitsnetz für KI-Anwendungen – doch Palo Alto Unit 42 zeigt mit genetischem Prompt Fuzzing, dass kein Modell wirklich sicher ist. Was das für Unternehmen bedeutet und was.

22. Apr. 2026 6 min
RAG erklärt: Wie KI mit eigenen Dokumenten arbeitet
KI-Tools

RAG erklärt: Wie KI mit eigenen Dokumenten arbeitet

RAG verspricht KI mit eigenem Wissen. Entscheidend ist aber nicht das Modell, sondern ob Retrieval, Datenqualität und Kontext stimmen.

01. Apr. 2026 6 min

Signal der Woche abonnieren

Eine Nachricht. Eine Analyse. Jeden Freitag im Newsletter.