Produktive IT-Systeme sollten
bedienbar sein – nicht
mysteriös.
Viele Systeme laufen stabil – bis etwas geändert werden muss. Ich helfe Teams dabei, gewachsene IT-Systeme wieder sicher zu betreiben, anzupassen und zu verantworten.
Wenn Systeme fragiler sind, als sie wirken
Diese Muster führen selten sofort zum Ausfall – aber sie erhöhen das Risiko mit jeder Änderung.
Abhängigkeit von Einzelwissen
Nur eine Person weiß wirklich, was gefahrlos geändert werden kann. Fehlt sie, zögert das Team – oder niemand fasst die Produktionsumgebung noch an.
Angst vor Änderungen
Routineaufgaben wie Updates, Konfigurationsänderungen oder Skalierung fühlen sich riskanter an, als sie sollten. Schon kleine Schritte erzeugen Unsicherheit.
Unklare Service-Landschaft
Die Systeme laufen, aber ihr tatsächliches Zusammenspiel ist unklar geworden. Dokumentation ist veraltet, lückenhaft oder fehlt ganz.
Von mysteriös zu wartbar
Ich beginne damit, aktuelles Verhalten sichtbar und nachvollziehbar zu machen. Daraus ergeben sich klare nächste Schritte: Akute Risiken, Wissenslücken und langfristiger Aufräumbedarf.Erfassen
Services, Abhängigkeiten, Verantwortlichkeiten, Zugriffswege und Fehlermodi aufnehmen, bevor etwas verändert wird.
Baseline
Logs, Metriken, Dashboards und Alerts in einen Zustand bringen, dem das Team wieder vertrauen kann.
Stabilisieren
Unmittelbare Risiken durch sichere Update-Wege, Backups, Rollback-Pfade und klare Prioritäten reduzieren.
Dokumentieren
Runbooks, Diagramme und Betriebsnotizen erstellen, damit Wissen nicht an einzelne Personen gebunden bleibt.
Typische Einstiegspunkte
Konkrete Situationen, in denen ein kurzer, strukturierter Einsatz operative Unsicherheit reduziert und die nächste Änderung weniger riskant macht.Monitoring- und Alerting-Baseline
Für Grafana, Prometheus, Loki oder ähnliche Setups, bei denen Zustand, Rauschen und Lücken schwer einzuschätzen sind.
Review komplexer Service-Stacks
Für gewachsene Service-Stacks wie ein selbst betriebenes GitLab, bei denen Konfiguration, Nutzung oder neue Anforderungen die Kapazität des Teams übersteigen.
Virtualisierungsbetrieb verbessern
Für Proxmox-ähnliche VM- und Container-Umgebungen, in denen Storage, Backups, Ressourcengrenzen oder Service-Abhängigkeiten ein klareres Betriebsmodell brauchen.
Schrittweise Migration gewachsener Systeme
Für Services, die klarere Verantwortung, sichereres Deployment oder eine schrittweise Ablösung brauchen – ohne riskante Unterbrechung des laufenden Betriebs.
Fangen wir mit einem kurzen Gespräch an
Viele fragile Produktionsumgebungen wirken von außen stabil. Ein kurzes Gespräch reicht oft, um zu klären, ob die Situation passt und welcher nächste Schritt sinnvoll wäre.
Unverbindlich
Vertraulich
Pragmatische Einschätzung
Über mich
Ich komme dazu, wenn Ihre IT-Systeme für einen klar eingegrenzten Einsatz zusätzliche Erfahrung brauchen.
Ich bin unabhängiger Software Engineer mit klarem Fokus auf IT-Service-Systeme. Ich arbeite gerne dort, wo es konkret wird: Logs, Dashboards, Shell-Sessions, Service-Konfigurationen, CI-Runner, VMs, Storage – und die Notizen, die erklären, warum ein System heute so aussieht.
In meiner Promotion am Max-Planck-Institut für molekulare Genetik in Berlin habe ich Bioinformatik-Pipelines und Storage-Systeme aufgebaut und betrieben. Am Deutschen Klimarechenzentrum in Hamburg habe ich diese Perspektive in einem HPC-Rechenzentrum erweitert, unter anderem mit Arbeit an Monitoring und Energieeffizienz.
Meine Stärke liegt in fokussierten Projekten: Echte Abhängigkeiten verstehen, die nächste Änderung sicherer machen, Blockaden beseitigen – und Wissen hinterlassen, das das Team wirklich nutzen kann.
Am stärksten in fokussierten Projekten
Geben Sie mir ein klares Ziel, Zugriff auf das System und Raum zum Arbeiten: Ich baue schnell Momentum auf, halte Erkenntnisse konkret und extrahiere aus unklaren Service-Setups Entscheidungen, mit denen das Team direkt weiterarbeiten kann.
Schnelle Orientierung in gewachsenen Systemen
Ich kann in Systeme mit lückenhafter Dokumentation einsteigen und die realen Abhängigkeiten finden, bevor sie verändert werden.
Technische Tiefe auf Betriebsebene
Monitoring-Stacks, Linux-Services, VMs, Container, Proxmox/Ceph, Storage und Pipelines sind vertrautes Terrain.
Arbeit, die ins Team zurückfließt
Ich will nicht der dauerhaft Verantwortliche Ihrer Infrastruktur werden. Das Ergebnis soll Ihrem Team helfen, das System zu betreiben, zu verändern und zu erklären.