Verteilte Systeme — Vorlesung 2
Prof. Dr. Alexandra Mikityuk · HTW Berlin · Sommersemester 2026
Claude kann Ihnen beim Designen, Coden und Testen helfen — Sie arbeiten schneller und lernen dabei neue Patterns kennen.
Sie müssen das System VERSTEHEN. Claude ist ein mächtiges Werkzeug — aber die Architekturentscheidungen und die Verantwortung liegen bei Ihnen.
Verbindung: MCP-Server = Microservices für KI. Wenn Sie verteilte Systeme verstehen, verstehen Sie auch, wie moderne KI-Agenten aufgebaut sind.
Claude-Output ohne eigenes Verständnis = nicht bestanden.
Projektidee (optional): Bauen Sie einen eigenen MCP-Server als Teil Ihres Semesterprojekts — ein Microservice, der Claude mit domänenspezifischen Tools erweitert.
Claude ist wie ein schneller Praktikant: produktiv, aber braucht klare Anweisungen und Code-Review von IHNEN.
the, ist, and
["Hal", "lo", " Welt"]
= 3 Tokens statt 2 Wörter
Warum? Der Tokenizer hat diese Fragmente aus den Trainingsdaten gelernt. "Hallo" ist seltener als englische Wörter und wird daher in Teilstücke zerlegt.
Ein Transformer ist eine Netzwerk-Architektur — ein Bauplan dafür, wie ein neuronales Netz intern aufgebaut ist.
Kein Algorithmus. Kein Microservice. Sondern die Struktur des Modells selbst.
Stellen Sie sich ein neuronales Netz wie ein Gebäude vor. "Transformer" beschreibt, wie die Stockwerke, Räume und Verbindungen angeordnet sind.
Weil er Eingabetext Schicht für Schicht in immer abstraktere Darstellungen transformiert (umwandelt), bis am Ende eine Vorhersage entsteht.
Jede Schicht berechnet die Relevanz zwischen allen Wörtern (Self-Attention) und verarbeitet das Ergebnis weiter. Claude, GPT, Gemini, LLaMA — alle sind Transformer. Gleicher Bauplan, unterschiedliche Größe und Trainingsdaten.
Verarbeitet Text Wort für Wort, sequenziell — wie Lesen von links nach rechts.
Jedes Wort wird verarbeitet und ein "Gedächtnis" (Hidden State) wird weitergegeben.
Problem: Bei langen Texten "vergisst" das Netz die ersten Wörter. Wie stille Post — am Ende kommt nur noch Rauschen an.
Verbesserte RNN mit einem "Notizbuch": Kann gezielt Informationen merken oder vergessen.
Hat "Gates" (Tore), die steuern, welche Infos behalten und welche verworfen werden.
Besser, aber: Immer noch sequenziell (langsam). Bei sehr langen Texten (>1000 Wörter) trotzdem Kontextverlust.
Beide Architekturen: sequenziell → Wort 1, dann Wort 2, dann Wort 3... → nicht parallelisierbar, langsam auf GPUs, Kontext geht verloren.
Statt Wort für Wort: Der Transformer sieht ALLE Wörter auf einmal und berechnet für jeden neuen Satz live, welche Wörter füreinander relevant sind.
Beispiel: "Die Katze saß auf der Matte, weil sie müde war"
→ Das Modell berechnet: "sie" hat hohe Relevanz zu "Katze", niedrige zu "Matte".
Woher weiß es das? Die Fähigkeit, Relevanz zu erkennen, kommt aus dem Training (Milliarden Sätze gelesen). Die konkrete Berechnung passiert live für jeden neuen Satz.
Wort → Wort → Wort → ... (sequenziell, langsam, vergisst)
Alle Wörter gleichzeitig (parallel, schnell, vergisst nichts)
Ohne Transformer: kein ChatGPT, kein Claude, kein modernes KI. Paper: "Attention Is All You Need" (Vaswani et al., 2017)
Riesige Textmengen aus dem Internet (Bücher, Wikipedia, Code, Webseiten).
Das Modell lernt Sprache, Grammatik, Fakten und Muster.
Dauer: Wochen bis Monate auf Tausenden GPUs
Spezialisierung auf bestimmte Aufgaben: Fragen beantworten, Code schreiben, Anweisungen befolgen.
Deutlich kleinerer, kuratierter Datensatz.
Dauer: Stunden bis Tage
Reinforcement Learning from Human Feedback: Menschen bewerten Antworten (gut/schlecht).
Das Modell lernt, hilfreiche und sichere Antworten zu bevorzugen.
Daher: Claude lehnt gefährliche Anfragen ab
Vereinfacht: Lesen lernen → Aufgaben üben → Feedback von Menschen
Open Source: OpenClaw (openclaw.org) — ein Open-Source-Projekt, das KI-Assistenten für alle Plattformen bereitstellt. Zeigt den Trend: KI-Entwicklung wird zunehmend offen und gemeinschaftlich.
| Modell | Unternehmen | Typ | Stärken |
|---|---|---|---|
| Claude (Opus, Sonnet, Haiku) | Anthropic | Cloud | Coding, Analyse, Sicherheit, langes Kontextfenster |
| GPT-4o / o3 | OpenAI | Cloud | Allrounder, breites Ökosystem, multimodal |
| Gemini | Cloud | Google-Integration, sehr langes Kontextfenster | |
| LLaMA | Meta | Open Source | Lokal nutzbar, starke Community, anpassbar |
| Mistral | Mistral AI (EU) | Open Source | EU-basiert, effizient, DSGVO-freundlich |
| Copilot | Microsoft / OpenAI | Cloud | Direkt in VS Code / GitHub integriert |
Alle basieren auf der Transformer-Architektur. Die Unterschiede liegen in Trainingsdaten, Größe, Feinabstimmung und Lizenz.
Beispiele: Claude Opus, GPT-4o, Gemini Ultra, LLaMA 405B
Beispiele: Phi-3, Gemma 2, LLaMA 7B, Mistral 7B
Wann welches? LLM für komplexe Aufgaben (Architektur-Entscheidungen, große Codebases). SLM für schnelle, einfache, private Aufgaben (Autovervollständigung, lokale Analyse).
Merke: Ein LLM ist ein extrem guter Textgenerator — kein allwissendes Orakel. Die "NICHT"-Spalte wird durch Tools und Agenten teilweise gelöst (nächste Vorlesung!).
Vertrauen Sie KI-generiertem Code NIEMALS blind — testen, reviewen, verstehen!
Ein LLM kennt nur seine Trainingsdaten. Es weiß nichts über Ihre Firma, Ihre Codebasis oder aktuelle Ereignisse → Halluzination!
Nicht einfach "Datei in den Chat kopieren" — sondern ein System, das automatisch die richtigen Dokumente findet und dem LLM gibt.
"Was ist unsere Urlaubsregelung?" → Claude erfindet eine Antwort
System findet HR-Dokument → fügt es dem Prompt hinzu → Claude antwortet korrekt
Wir nutzen Claude, weil das Education-Programm und die Coding-Stärke am besten zu unserem Kurs passen.
Sie dürfen für Ihr Projekt auch andere Tools nutzen! Wichtig ist, dass Sie den Code verstehen — nicht welches Tool ihn erzeugt hat.
Für Learning Mode (führt durch Denkprozesse statt Antworten zu geben), API-Credits und campus-weiten Zugang: Die Universität muss Anthropic direkt kontaktieren.
Sie können selbstständig Kurse und Zertifikate absolvieren:
Claude 101, Claude Code 101, AI Fluency, MCP
Registrieren Sie sich kostenlos auf claude.ai — das reicht für den Einstieg!
Claude Code ist die KI-Engine für Entwickler — sie läuft in zwei Modi:
# Claude Code starten
$ claude
# Beispiel-Prompts:
> Erkläre mir dieses Projekt
> Finde den Bug in server.py
> Schreibe Unit-Tests für api.py
Wenn Sie die VS Code Extension nutzen, nutzen Sie bereits Claude Code! Es ist dieselbe Engine.
"Claude, schreibe mir alles"
Sie designen, Claude implementiert
Claude ist wie ein sehr schneller Praktikant: produktiv, aber braucht klare Anweisungen und Code-Review.
Sie müssen VORHER wissen: Architektur, Datenstrukturen, Schnittstellen, Fehlerbehandlung.
1. ZUERST selbst denken: Systemarchitektur skizzieren — Welche Komponenten? Wie kommunizieren sie?
2. Variablen & Datenstrukturen definieren: Welche Daten? Welche Typen? Welches Format?
3. Schnittstellen festlegen: API-Endpunkte, Socket-Protokoll, Nachrichtenformat
4. DANN Claude beauftragen: Spezifische, kleine Aufgaben geben — nicht "mach alles"
5. Code REVIEWEN: Verstehe ich jede Zeile? Gibt es Sicherheitslücken? Edge Cases?
6. Testen & Iterieren: Fehler finden, Prompt verfeinern, erneut generieren lassen
MEIN Systemdesign (bevor ich Claude frage):
MEIN SYSTEMDESIGN (bevor ich Claude frage):
├── Backend (Python, Flask)
│ ├── GET /api/weather?city=Berlin → Wetterdaten als JSON
│ ├── Daten von OpenWeatherMap API holen
│ └── Caching: Gleiche Stadt nur alle 10 Min neu abfragen
├── Frontend (HTML + JavaScript)
│ ├── Eingabefeld für Stadtname
│ ├── fetch() ruft Backend-API auf
│ └── Temperatur, Wind, Icon anzeigen
└── Datenmodell
├── Eingabe: {"city": "Berlin"}
└── Ausgabe: {"temp": 18.5, "wind": 12, "desc": "bewölkt"}
Das ist die Arbeit des Senior Developers! Sie treffen die Entscheidungen über Architektur, API-Design und Datenformat — BEVOR Claude eine einzige Zeile schreibt.
Erstelle das Backend für mein
Wetter-Dashboard:
- Python mit Flask
- GET /api/weather?city=Berlin
- Daten von OpenWeatherMap holen
(API-Key als Umgebungsvariable)
- Antwort als JSON:
{"temp", "wind", "desc", "icon"}
- Caching mit Dictionary:
gleiche Stadt nur alle 10 Min
neu abfragen
- Fehlerbehandlung: Stadt nicht
gefunden → 404 mit Meldung
"Schreibe mir eine Wetter-App"
→ Welches Framework?
→ Welche API?
→ Welches Datenformat?
→ Keine Fehlerbehandlung
→ Claude entscheidet alles
→ Sie verstehen den Code nicht
Je weniger Sie vorgeben, desto weniger verstehen Sie das Ergebnis!
Was Sie bei KI-generiertem Code prüfen müssen:
Wenn Sie eine Zeile nicht erklären können, haben Sie den Code nicht verstanden!
"Mach mir eine API"
"Erstelle einen REST-Server in
Python mit Flask:
- GET /api/sensors -> Liste (JSON)
- POST /api/sensors -> Hinzufügen
- Verwende SQLite
- Füge Error-Handling hinzu"
# Guter Prompt für Claude Code:
Erstelle eine REST-API für eine
To-Do-Liste in Python mit Flask:
- GET /todos → alle Einträge
- POST /todos → neuen Eintrag
- DELETE /todos/<id> → löschen
- Daten in SQLite speichern
- Nur Standardbibliotheken + Flask
- Mit Docstrings und Typen
- Schreibe 3 Unit-Tests
✓ LLMs, Tokens & Transformer verstanden
✓ RNN → LSTM → Transformer Evolution
✓ KI-Landschaft 2026: Wer bietet was?
✓ LLM vs. SLM — wann welches?
✓ Training: Pre-Training → Fine-Tuning → RLHF
✓ Halluzinationen erkennen & vermeiden
✓ Claude & Claude Code einsetzen
✓ Senior Developer Workflow mit KI
✓ Prompt Engineering Grundlagen
✓ Was LLMs können — und was nicht
Fragen?
Prof. Dr. Alexandra Mikityuk
Büro Raum 308
Tel +49 30 5019-2664
Nächste Woche: KI-Agenten, MCP & Sicherheit