Site reliability engineers, or SRE engineers, are coding and software automation experts who optimize information technology (IT) infrastructure and processes. They do this by configuring smart codes, tools and applications that streamline operations and enhance productivity from the beginning to the end of the software development lifecycle (SDLC). Google introduced the SRE engineering role in the early 2000’s to operate at the crossroads between software development and IT operations, or DevOps, and it has been growing in popularity ever since.

 

The SRE role and responsibilities include software automation, monitoring, troubleshooting, problem solving, documentation, and team collaboration. Specifically, the role requires a high level of expertise in writing code to automate processes such as log analysis and testing, while responding to any new DevOps issues that arise. 

 

Automating processes allows the developers to focus on bringing new features quickly to production and reduces the burden on the IT operations team. An SRE engineer applies software engineering principles to ensure reliable and scalable performance of software and IT services. Site reliability engineers regularly work alongside teams of software developers and IT engineers, guiding them along the development.

 

Site reliability engineering is essential for any organization that needs to continuously improve their people, processes, and technology. SREs help teams to transition to a true DevOps culture, offering numerous benefits to increase speed and reliability. Popular job opportunities for site reliability engineers include at major tech companies, for eCommerce companies, or in payments, banking, and medical software development. As technology continues to evolve, so will site reliability engineering. This means, there will be only more opportunities for SRE engineers!

Apply now for a job as a site reliability engineer! 

Test Site Assitent & Fahrer (m/w/d)

Location: Augsburg

Branche: Aerospace

Expertise: Transport & Logistics

Experience: 1 years

Die Tätigkeit als Test Site Assitent & Fahrer (m/w/d) umfasst die unterstützung des Teams vor Ort durch das Fahren von LKW oder Traktor Durchführung von Fahrten zwischen verschiedenen Standorten im Raum Ulm zur Unterstützung des Teams Überprüfung und Organisation von Wartung und TÜV-Terminen für Fahrzeuge und Anhänger Koordination und Abstimmung mit unterschiedlichen internen und externen Stakeholdern Organisation des Zugangs von Lieferanten und Besuchern zu den Einrichtungen Abschließend die unterstützung des Teams bei der Bearbeitung und Abwicklung von Bestellungen

Reliability Manager / Instandhaltungsleiter (w/m/d)

Location: Wuppertal

Branche: Machine & Plant Design

Expertise: Production & Manufacturing

Experience: 3 years

Implementierung notwendiger Sicherheitsstandards sowie Förderung einer proaktiven Sicherheitskultur im Team Entwicklung und Umsetzung von Instandhaltungsstrategien zur Sicherstellung der Anlagenverfügbarkeit Kontinuierliche Optimierung der Instandhaltungsprozesse zur Vermeidung ungeplanter Stillstände Einführung neuer Technologien zur Steigerung der Effizienz und Anlagenleistung Budgetierung und Ressourcenplanung für den Bereich Wartung und Instandhaltung Führung und Entwicklung des Instandhaltungsteams sowie Schulung der Mitarbeitenden Auswertung und Dokumentation von Wartungsberichten und Störungsmeldungen Planung, Analyse und Optimierung von Reparaturen und Instandsetzungsmaßnahmen Entwicklung nachhaltiger Konzepte zur Steigerung der Overall Equipment Effectiveness (OEE) Verantwortung für CapEx-Projekte im Bereich Energie, Automatisierung und Infrastruktur Unterstützung bei der Umsetzung von Lean-Methoden sowie World Class Manufacturing Programmen

Reliability Engineer

Location: Bentley

Branche: Infrastructure

Expertise: Communications & Distribution

Experience: 2 years

Analyse and develop methods to assess performance of critical systems and assets Support the System Performance Manager with short term performance improvement planning Develop and update asset reliability strategies and protocols Review asset criticality and condition assessments across generation, transmission, and distribution assets Engage and manage consultants and contractors as needed Provide engineering advice that supports both operational effectiveness and strategic planning

Systems Engineer (w/m/d)

Location: Zipf

Branche: Medical devices

Expertise: Production & Manufacturing

Experience: 2 years

Sie führen akustische und thermische Messungen an Ultraschallsonden durch und stellen dabei höchste Qualitätsstandards sicher. Sie bestimmen Bildqualitätsparameter und nehmen Ultraschallbilder zur Analyse auf. Sie führen elektrische Messungen zur Bewertung der Sondenfunktion durch. Sie planen und koordinieren Messabläufe sowie Analysen eigenverantwortlich und arbeiten dabei eng mit anderen Fachabteilungen zusammen.

System Engineer - GSI (d/m/w)

Branche: Aerospace

Expertise: IT & Shared Services

Experience: 3 years

Planung und Koordination komplexer Entwicklungsaufgaben im Rahmen eines militärischen Drohnenprojekts, insbesondere für die Bodenstation (L2-System) Übernahme der Rolle als System Engineer für das Bodensystem, inklusive technischer Definition, Steuerung der Entwicklung sowie Management von Anforderungen und Nachweisdokumentation (inkl. DOA/DAL-relevanter Inhalte) Verantwortung für Systems Engineering, Requirements Engineering sowie die fachliche Führung und Koordination des Entwicklungsteams in enger Abstimmung mit CI Technical Lead und Chief Engineer des L1-Systems Definition und Abstimmung von Zeitplänen, Priorisierung von Arbeitspaketen, Fortschrittsüberwachung sowie Entwicklung und Umsetzung von Recovery-Maßnahmen bei Abweichungen vom Plan Enge Zusammenarbeit mit dem Chief Engineer und dem COC in Getafe zur Zielerreichung sowie zur Beurteilung und Bewertung technischer Entwicklungsschritte unter Berücksichtigung von Terminen, Kosten und Kapazitäten Schnittstellenmanagement zu benachbarten L2-Systemen sowie kontinuierliche Durchführung von Soll-Ist-Vergleichen und Einleitung entsprechender Korrekturmaßnahmen Unterstützung des Einkaufs bei Lieferantenauswahl und Vertragsgestaltung, sowie technische Betreuung und Steuerung von externen Entwicklungsdienstleistern Eigenständige Bearbeitung anspruchsvoller Entwicklungsaufgaben, Gestaltung komplexer Schnittstellen und Integration neuer Technologien unter Berücksichtigung funktionaler, wirtschaftlicher und baulicher Anforderungen Bewertung, Abstimmung und Dokumentation konstruktiver Lösungen sowie Prüfung und Freigabe relevanter technischer Unterlagen und Datensätze

Quality Engineer (w/m/d)

Location: Bremen

Branche: Machine & Plant Design

Expertise: Quality Management

Experience: 3 years

Organisation und Priorisierung der Qualitätsmeldungen / Non-Conformities in der Fertigung Qualität der Beschreibung der Qualitätsmeldung sicherstellen Zusammen mit dem Production Engineering die direkten Auswirkung der Qualitätsmeldung auf den Produktionsfluss analysieren und ad-hoc Maßnahmen definieren Qualitätsmeldung im Sinne eines Projektansatzes abarbeiten, verfolgen und schließen Aktions-Workflow definieren und mit den Verantwortlichen die Lieferdaten und Liefergegenstände vereinbaren In enger Abstimmung mit dem Production Engineering Team die notwendigen Arbeitsaufträge realisieren Abarbeitung der Aktionen verfolgen, und Ergebnisse aktiv einfordern Aktionen ggf. zur Priorisierung eskalieren Ursachenanalyse wo notwendig einleiten

Industrial Engineer (w/m/d)

Location: Stuttgart

Branche: Machine & Plant Design

Expertise: Production & Manufacturing

Experience: 2 years

Entwicklung des Layouts für einen neuen Standort zur Motorenmontage Optimierung der Produktionsfläche (Effizienz, Arbeitsfluss, Materialtransport, Sicherheitsvorschriften) Zusammenarbeit mit interdisziplinären Teams zur Sicherstellung technischer Anforderungen und Produktionsziele Analyse bestehender Prozesse zur Identifikation von Verbesserungspotenzialen

Manager - Technical Site Services

Location: Maastricht

Branche: Life Sciences

Expertise: Production & Manufacturing

Experience: 4 years

Als Manager - Technical Site Services ben je onderdeel van het Site Operating Team en rapporteer je direct aan de Operations Manager. Je schakelt tussen techniek, onderhoud, contractors en interne teams om alles op rolletjes te laten lopen. Onderhoud verbeteren: Je optimaliseert preventieve en correctieve onderhoudsprocessen om maximale technische beschikbaarheid van de installaties te garanderen. Projectmanagement: Je leidt zelfstandig technische projecten op de site en begeleidt kleine multidisciplinaire wijzigingen. Aansturen van contractors: Je bewaakt kwaliteit, veiligheid en kosten bij inzet van externe partijen. Change management: Je leidt het Management of Change (MoC) proces voor technische aanpassingen. Facility & IT: Je bent verantwoordelijk voor utilities, technische inkoop, facilitaire zaken én fungeert als aanspreekpunt voor IT op de site. Teamlead: Je geeft leiding aan het onderhoudsteam en werkt nauw samen met andere disciplines binnen de locatie.

Supplier Quality Engineer (m/w/d)

Branche: Machine & Plant Design

Expertise: Production & Manufacturing

Experience: 2 years

Prüfung, Entwicklung und Auditierung von Lieferanten Vorbereitung der Lieferantenauswahl in Zusammenarbeit mit dem Einkauf Definition von Qualitätsstandards und Liefervorschriften Steuerung von Abweichungen und Korrekturmaßnahmen Durchführung von Lieferantenbewertungen und Entwicklungsplänen Umsetzung von Qualitätsanforderungen gemäß IATF 16949 und ISO 9001 Bearbeitung von Reklamationen und Kundenanforderungen Stellvertretung der Qualitätsleitung

Embedded Software Engineer (m/w/d)

Location: Würzburg

Branche: Information Technology

Expertise: IT & Shared Services

Experience: 2 years

Sie sind verantwortlich für die Entwicklung, das Debugging und Testen von Basis-Komponenten in C/C++ zukünftiger Steuergeräte aktiv. Sie übernehmen die Konfiguration und Integration von Software-Bestandteilen mithilfe der Vector Toolchain Sie unterstützen durch Ihre Mitarbeit das Integrationsteam im Rahmen der Umsetzung eines zentralen und hochintegrierten Steuergerätes.

Quality Engineer Steuergeräte (w/m/d)

Location: Regensburg

Branche: Automotive

Expertise: Quality Management

Experience: 2 years

Sie übernehmen die Lieferanten-Potentialanalyse zur Feststellung der Prozessfähigkeit gegen Prozessnormen. Die Organisation und Durchführung von Prozess- und Qualitäts-Audits/ Assessments bei Lieferanten gehören ebenfalls zu Ihrem Tätigkeitsprofil. Sie übernehmen ebenfalls die Abarbeitung von Beanstandungen und Problemlösung mittels 8D Prozess. Sie wirken bei den Herstellbarkeitsbewertungen, Risikoanalysen, Lastenhefterstellung und der Implementierung der notwendigen Prozesse mit. Die Sicherstellung der Prüfung der Produktqualität während der Entwicklungsphase und in der Serie entsprechend Vorgaben bzw. Spezifikation liegt in Ihrer Verantwortung.

System Engineer Energysystems

Location: Wien

Branche: Renewable Energy

Expertise: Research & Development

Experience: 2 years

Als System Engineer sind Sie für die technische Abwicklung des Systems elektrische Anlagen verantwortlich. Sie sind erster Ansprechpartner:in für Kund:innen, Consultants, Engineers und Lieferant:innen. Detailliert erarbeiten Sie Konzepte der elektrischen Anlagenteile und verantworten die technische Abwicklung von der Auslegung bis zur Inbetriebnahme. Im Projekt behalten Sie die Termine, Qualität und Kosten im Blick und erstellen Reportings. Zudem arbeiten Sie am Risk und Claim Management aktiv mit.

Common site reliability engineer roles and responsibilities

A site reliability engineer is responsible for performing a range of important software engineering tasks. Responsibilities may include:

  • Analyzing DevOps processes and IT architecture for areas of optimization for continuous improvement;
  • Monitoring symptoms documenting every action to automate it through code;
  • Improving operational processes and design, build, and maintain core infrastructure for scaling;
  • Being on-call to respond to incidents that impact product or software availability;
  • Troubleshooting and debugging issues to fix them to ensure high productivity;
  • Preventing incidents from happening;
  • Planning and facilitating IT infrastructure growth;
  • Providing support to, and collaborating with, engineers, developers, and specialists to develop and deploy the codes, tools, and applications in software products;
  • Tracking progress and documenting knowledge and processes;
  • Delivering results in line with agreed SRE engineering project timelines and budgets;
  • Delivering software engineering outputs in compliance with relevant requirements, and in line with customer needs and demands;
  • Leading trainings on software engineering and development as needed.

Qualifications for site reliability engineers

SRE engineers should have at least a Bachelor’s degree in Software Engineering, Computer Science, or related.

 

Additional supporting skills and experience include:

  • 2-4+ years of software engineering experience;
  • Solid understanding of coding, DevOps, and IT infrastructures using programming languages such as Python, Go, or Ruby;
  • Excellent analytical and natural problem-solving skills;
  • Proficiency in using diverse software, including Chef, Ansible, Terraform, SaltStack, GitLab CI/CD, Kubernetes, AWS CloudWatch, NewRelic, PagerDuty, VictorOps, Jira and Trello, and similar;
  • Proven experience in project and team management;
  • Strong verbal and written communication skills to be able to work easily with developers, engineers, and other diverse team members.