Unsere Monitoring-Basis Uptime Kuma

Ein Einblick wie Iridium Works ein mehrschichtiges Monitoring aufbaut das durch Open Source Tools eigene Automatisierung und proaktive Alerts für zuverlässige Systeme sorgt.

Warum Monitoring einer der stärksten Grundbausteine unserer Kundenbetreuung ist

Monitoring ist kein Zusatz im modernen Softwarebetrieb. Es ist eine unverzichtbare Schutzschicht die Stabilität Leistung und Vertrauen sichert. Bei Iridium Works setzen wir auf ein Setup das Open Source Flexibilität mit eigener Automatisierung kombiniert damit wir immer wissen wie sich unsere Systeme verhalten bevor es Nutzer bemerken.

Unsere Monitoring Basis Uptime Kuma

Uptime Kuma ist ein Open Source Tool mit dem wir die Verfügbarkeit von Services mit voller Kontrolle überwachen. Anders als bei geschlossenen Plattformen können wir es beliebig erweitern anpassen und tief in unsere Abläufe integrieren.

Eine vereinfachte Übersicht zeigt welche Ebenen wir überwachen:

Monitoring LayerDescription
HTTP Status CodesContinuous checks to detect failures slow responses or recurring error patterns
Health EndpointsDirect checks of backend service status through dedicated /health routes
API Route MonitoringCustom payloads that verify expected responses for critical API flows
Slack AlertsImmediate notifications when conditions occur such as non recovering services

Eigene Payload Checks für API Routen

Geschäftskritische Prozesse lassen sich nur durch die tatsächlichen Daten prüfen die eine API zurückgibt. Daher nutzen wir eigene Payload Checks. Jeder Check stellt sicher dass der Service nicht nur antwortet sondern auch korrekt funktioniert.

Ein Beispiel wie ein solcher Check grundsätzlich aussehen kann:

// Pseudocode example for a custom API validation 
const response = await fetch("https://api.example.com/status", { method: "POST", body: JSON.stringify({ token: "12345" }) })

if (response.status !== 200) alert("Service unreachable")
if (response.data.health !== "ok") alert("Unexpected API state")

Die Bedeutung von HTTP Status Codes im Monitoring

HTTP Status Codes gehören zu den grundlegendsten Signalen für die Erkennung von Problemen in digitalen Systemen. Jede Anfrage zwischen Client und Server erzeugt einen numerischen Code der das Ergebnis des Vorgangs widerspiegelt. Codes im Bereich 200 zeigen dass alles wie erwartet funktioniert. Der Bereich 300 steht für Umleitungen die beabsichtigt oder unbeabsichtigt sein können. Ab den 400er Codes machen sich Fehler sichtbar bei denen eine Anfrage nicht erfüllt werden kann meist aufgrund von Client Problemen. Die 500er Codes weisen auf Server Fehler hin die sofortige Aufmerksamkeit erfordern. Durch die kontinuierliche Überwachung dieser Codes erhalten wir frühzeitig Einblick in Leistungsabfälle wiederkehrende Fehlermuster oder plötzliche Ausfälle. Diese Ebene ist der schnellste und direkteste Indikator für den Zustand eines Systems.

Status Code Bereich Bedeutung
100–199 Informationelle Antworten die zeigen dass die Anfrage verarbeitet wird
200–299 Erfolgreiche Antworten die anzeigen dass die Anfrage korrekt ausgeführt wurde
300–399 Umleitungen bei denen der Client weitere Schritte ausführen muss
400–499 Client Fehler durch ungültige Anfragen oder fehlende Berechtigungen
500–599 Server Fehler die auf Probleme in der Anwendung oder Infrastruktur hinweisen

Unsere selbst entwickelte Slack App

Wir haben eine Slack Integration entwickelt die direkt über einen Webhook angebunden ist. Sie löst aus sobald Monitoring Schwellenwerte überschritten werden zum Beispiel wenn sich ein Service nach zwei automatischen Versuchen nicht selbst wiederherstellt.

Vorteile dieses Setups

Vorteil Auswirkung
Volle Kontrolle durch Open Source Kein Vendor Lock in und maximale Flexibilität
Mehrschichtiges Monitoring Frühe Erkennung von Problemen über mehrere Ebenen
Direkte Slack Alerts Schnellere Reaktion und geringere Ausfallzeiten
Eigene Payload Checks Prüft gesamte Geschäftsabläufe statt nur Server Antworten

Mögliche Nachteile

Nachteil Beschreibung
Manuelle Einrichtung Größere Infrastrukturen benötigen zu Beginn Konfigurationsaufwand
Keine native Anomalie Erkennung Erweiterte Analysen benötigen zusätzliche Tools
Komplexere Dashboards bei vielen Services Wachstum führt zu mehr Übersichtspflege

Mögliche Erweiterungen

Erweiterung Mehrwert
Automatische Incident Klassifizierung Schnellere Priorisierung anhand definierter Regeln
KI basierte Anomalie Erkennung Proaktive Alerts bei unerwarteten Mustern
Integration in Deployment Pipelines Automatische Checks nach Releases für sichere Rollouts

Monitoring bleibt einer der wichtigsten Bausteine für stabile digitale Produkte. Je stärker das Monitoring desto höher das Vertrauen Ihrer Nutzer in die Qualität Ihrer Anwendung.

Über den Autor

Alessandro ist technischer Mastermind und Chief Technology Officer bei Iridium Works. Im Laufe der Jahre hat er unzählige Systeme in Zusammenarbeit mit Front- und Backend, DevOps und als Tech Lead entwickelt. Er schreibt über neue Technologien und Softwareentwicklung.

Alessandro Frank
CTO
bei Iridium Works
📍
Koblenz, Deuschland
🔗
Gesamte Biogrpafie
🔗
LinkedIn Profil
Lassen Sie uns gemeinsam Ihre digitale Zukunft gestalten.
Wir entwickeln digitale Erlebnisse für Pioniere, die den Status quo herausfordern wollen, damit sie sich an die Spitze ihrer Konkurrenz setzen können.
Text reading 'Iridium Works' with a blue marbled texture fill on a transparent background.
Black and white close-up portrait of a man with a bald head, full beard, and checkered shirt looking directly at the camera.
Portrait of a woman with long dark hair, wearing black glasses, a black blazer, and a light gray top, against a plain gray background.
Smiling bald man with a beard wearing a white dress shirt with his arms crossed, standing against a dark blue textured wall.
Smiling man wearing glasses, a navy blazer, white shirt, and jeans, sitting on a wooden stool against a plain background.
Young man with glasses, beige zip-up sweater, white shirt, and gray pants sitting on a wooden stool against a light gray background.
© Iridium Works GmbH. Alle Rechte vorbehalten.
Willkommen bei digitaler Excellence.