Produktive IT-Systeme sollten
berechenbar sein - nicht mysteriös.

Viele Systeme laufen stabil, bis etwas geändert werden muss. Ich helfe Teams dabei, gewachsene IT-Systeme wieder sicher zu betreiben, anzupassen und zu verantworten.

Anzeichen

Wenn Systeme fragiler sind, als sie wirken

Diese Muster führen selten sofort zum Ausfall, aber sie erhöhen das Risiko mit jeder Änderung.

Abhängigkeit von Einzelwissen

Nur eine Person weiß wirklich, was gefahrlos geändert werden kann. Fehlt sie, zögert das Team, oder niemand fasst die Produktionsumgebung noch an.

Angst vor Änderungen

Routineaufgaben wie Updates, Konfigurationsänderungen oder Skalierung fühlen sich riskanter an, als sie sollten. Schon kleine Schritte erzeugen Unsicherheit.

Unklare Service-Landschaft

Die Systeme laufen, aber ihr tatsächliches Zusammenspiel ist unklar geworden. Dokumentation ist veraltet, lückenhaft oder fehlt ganz.

Von mysteriös zu planbar

Ob der Auslöser ein akutes Problem oder ein geplantes Projekt aus dem Backlog ist: Ich beginne damit, aktuelles Verhalten sichtbar und nachvollziehbar zu machen. Daraus ergeben sich klare nächste Schritte: Akute Risiken, Wissenslücken und langfristiger Aufräumbedarf.

Inventarisieren

Services, Abhängigkeiten und Verantwortlichkeiten aufnehmen und klären, wer das Risiko trägt, wenn etwas ausfällt.

Sichtbar machen

Einen messbaren Ist-Zustand herstellen aus Logs, Metriken, Dashboards und Alerts, bevor eingegriffen wird.

Stabilisieren

Schritt für Schritt: Rollback-fähige Updates, Migrationen oder Plattformwechsel.

Übergeben

Runbooks, Diagramme und Betriebsnotizen zusammenstellen, auf die Ihr Team eigenständig aufbauen kann.

Typische Einstiegspunkte

Konkrete Situationen, in denen ein kurzer, strukturierter Einsatz operative Unsicherheit reduziert und die nächste Änderung weniger riskant macht.

Monitoring- und Alerting-Baseline

Für Grafana, Prometheus, Loki oder ähnliche Setups, bei denen Zustand, Rauschen und Lücken schwer einzuschätzen sind.

Review komplexer Service-Stacks

Für gewachsene Service-Stacks wie ein selbst betriebenes GitLab, bei denen Konfiguration, Nutzung oder neue Anforderungen die Kapazität des Teams übersteigen.

Virtualisierungsbetrieb verbessern

Für Proxmox-ähnliche VM- und Container-Umgebungen, in denen Storage, Backups, Ressourcengrenzen oder Service-Abhängigkeiten ein klareres Betriebsmodell brauchen.

Schrittweise Migration gewachsener Systeme

Für Services, die klarere Verantwortung, sichereres Deployment oder eine schrittweise Ablösung brauchen, ohne riskante Unterbrechung des laufenden Betriebs.

Wie es weitergeht

Fangen wir mit einem kurzen Gespräch an

Viele fragile Produktionsumgebungen wirken von außen stabil. Ein kurzes Gespräch reicht oft, um zu klären, ob die Situation passt und welcher nächste Schritt sinnvoll wäre.

Erstgespräch anfragen

Kurz & Effizient

Unverbindlich

Vertraulich

Pragmatische Einschätzung

Über mich

Ich komme dazu, wenn Ihre IT-Systeme für einen klar eingegrenzten Einsatz tatkräftige Unterstützung von außen brauchen.

Ich bin unabhängiger Software Engineer mit klarem Fokus auf IT-Service-Systeme. Ich arbeite gerne dort, wo es konkret wird: Logs, Dashboards, Shell-Sessions, Service-Konfigurationen, CI-Runner, VMs sowie die Notizen, die erklären, warum ein System heute so aussieht.

In meiner Promotion am Max-Planck-Institut für molekulare Genetik in Berlin habe ich Bioinformatik-Pipelines aufgebaut und betrieben. Am Deutschen Klimarechenzentrum in Hamburg habe ich diese Perspektive in einem HPC-Rechenzentrum erweitert, unter anderem mit Arbeit an Monitoring und Energieeffizienz. Andere Größenordnung, dasselbe Problem: nicht immer genug Hände für die Arbeit, die das System braucht.

Meine Stärke liegt in fokussierten Projekten: Echte Abhängigkeiten verstehen, die nächste Änderung sicherer machen, Blockaden beseitigen und Wissen hinterlassen, das das Team wirklich nutzen kann.

Am stärksten in fokussierten Projekten

Geben Sie mir ein klares Ziel, Zugriff auf das System und Raum zum Arbeiten: Ich baue schnell Momentum auf, halte Erkenntnisse konkret und extrahiere aus unklaren Service-Setups Entscheidungen, mit denen das Team direkt weiterarbeiten kann.

Schnelle Orientierung in gewachsenen Systemen

Ich kann in Systeme mit lückenhafter Dokumentation einsteigen und die realen Abhängigkeiten finden, bevor sie verändert werden.

Technische Tiefe auf Betriebsebene

Monitoring-Stacks, Linux-Services, VMs, Container, Proxmox/Ceph, Storage und Pipelines sind vertrautes Terrain.

Arbeit, die ins Team zurückfließt

Ich will nicht der dauerhaft Verantwortliche Ihrer Infrastruktur werden. Wenn mein Einsatz endet, kann Ihr Team das System betreiben, verändern und erklären.

Produktive IT-Systeme sollten berechenbar sein - nicht mysteriös.