AI Inference Engineer (all genders)
Was erwartet dich
- Du konzipierst, entwickelst und betreibst produktive LLM-Inferenzplattformen für Kunden mit hohen Anforderungen an Datensouveränität, Sicherheit und Betriebskontrolle – on-premises, in privaten Cloud-Umgebungen oder souveränen europäischen Cloud-Setups.
- Gemeinsam mit Cloud-, Plattform-, Security- und Data-Engineering-Teams sowie unseren Kunden überführst du AI-Use-Cases in den produktiven Betrieb.
- Dabei integrierst du moderne Inferenz-Engines und Open-Weights-Modelle in Kubernetes-, Container- und Plattformumgebungen.
- Außerdem planst und optimierst du GPU- und Speicherressourcen sowie Inferenz-Workloads: Von Modellgrößen, Quantisierung und Batching bis hin zu KV-Cache-Strategien, Latenz, Durchsatz und Kosten.
- Du verantwortest die Runtime produktiver AI-Systeme, inklusive Modellserving, APIs, Authentifizierung, Secrets, Observability, Logging
- Aus Kundenprojekten entwickelst du wiederverwendbare Referenzarchitekturen, Deployment-Templates und Betriebs-Playbooks und stärkst so unsere Applied-AI-Capability.
Was erwarten wir von dir
- Persönlicher Background: Erfahrung in Platform Engineering, Cloud Infrastructure, MLOps, LLMOps, DevOps, Backend Engineering oder Machine Learning Engineering. Entscheidend ist deine Erfahrung im Aufbau und Betrieb produktiver Systeme und dein Antrieb zu schneller persönlicher Weiterentwicklung
- Inference Engineering: Du verstehst die technischen und wirtschaftlichen Zusammenhänge moderner LLM-Inferenz, von Model-Serving und GPU-Auslastung über Quantisierung, Batching und KV-Cache-Management bis hin zu Latenz, Durchsatz und Kosten.
- Cloud & Plattformen: Docker, Kubernetes, Helm, Terraform, CI/CD, Linux sowie Observability gehören für dich zum Arbeitsalltag.
- AI-Verständnis: Du kannst Transformer-basierte Modelle wie LLMs und Embeddings einordnen und fundierte technische Entscheidungen für produktive AI-Systeme treffen.
- Security & Governance: Themen wie Identitäten, Berechtigungen, Secrets, Logging, Auditierung und Compliance denkst du, insbesondere in regulierten Umgebungen, von Anfang an mit.
- Kommunikation & Arbeitsweise: Du vermittelst komplexe technische Zusammenhänge verständlich, arbeitest pragmatisch und bewegst dich auch in dynamischen Projektumfeldern sicher.
- Pluspunkt: Erfahrung mit vLLM, SGLang oder vergleichbaren Inference-Technologien, GPU-Clustern, souveränen Cloud- oder Private-Cloud-Umgebungen.
- On the road: Du bist reisebereit und flexibel, unsere Kunden bundesweit vor Ort zu beraten.
- Let's talk: Du sprichst fließend Deutsch und Englisch - super, dann findest du dich bei Exxeta bestens zurecht
Warum Exxeta
Bei Exxeta entwickeln wir digitale Lösungen, die wirklich etwas verändern – in Unternehmen, Märkten und Köpfen. Über 1200 Kolleg:innen bringen dafür Technologie, Ideen und unterschiedliche Perspektiven zusammen. Was uns antreibt: Neugier, Teamspirit und der Anspruch, echten Impact zu schaffen. Hightech with a heartbeat eben.
Empfohlene Jobs
(Senior) Manager Public Sector Health Care - Transformation, KI & Prozessautomatisierung (w/m/d)
Du willst unsere Mandant:innen mit Deiner Expertise im Bereich Health Care beraten und unterstützen? Dann kannst Du Dich hier aktiv einbringen: Du übernimmst die Leitung komplexer Transformations-…
Industriemechaniker (m/w/d) Fachkraft
Wir bei ARWA Personaldienstleistungen GmbH haben Ihren neuen Traumjob als Industriemechaniker (m/w/d) für Sie! In Mannheim wartet bereits im Rahmen der Arbeitnehmerüberlassung mit Option auf Üb…
Referentin / Referent Individualprävention (m/w/d) - Dezernat Einwirkung und Berufskrankheiten
Die Direktion Mannheim sucht für das Dezernat Einwirkungen und Berufskrankheiten zum nächstmöglichen Zeitpunkt eine / einen Referentin / Referent Individualprävention (m/w/d) Ihre Aufgaben B…
Bilanzbuchhalter Rechnungswesen (m/w/d)
Sie arbeiten präzise, haben ein ausgeprägtes Zahlenverständnis und behalten auch bei komplexen Abschlüssen den Überblick? Dann bietet sich hier die passende Gelegenheit! Für unseren Kunden im Rau…
Montagemitarbeiter (m/w/d)
Über uns Wir bei office people bringen täglich tausende Menschen mit unserem weit verzweigten Kundennetzwerk zusammen. Als erfahrener Personaldienstleister sind wir an über 130 Standorten in 10 Län…
Vertriebsassistenz - Schwerpunkt Terminvereinbarung (m/w/d)
Ihre Aufgaben: Unterstützung des Außendienstes im Akquise Prozess Terminplanung und -koordination Aufbau und Pflege von Kundenbeziehungen Datenpflege und Dokumentation Ihre Quali…
Manager P2M Solutions - SAP modules PP-PI, APO, QM (m/w/d) HPJB1_DE
FUCHS ist der weltweit größte unabhängige Anbieter von innovativen Schmierstofflösungen für nahezu alle Branchen und Anwendungsbereiche. Unsere Produkte und Lösungen halten die Welt in Bewegung, auch …
Mitarbeiter Service und Logistik (m/w/d)
Willkommen bei BAUHAUS! BAUHAUS baut vor allem auf eines: Den Einsatz aller Mitarbeiter:innen - füreinander und für jeden einzelnen Kunden. Denn nur mit Respekt, Zusammenhalt und Leidenschaft macht…
Kaufmännischer Sachbearbeiter im Backoffice (m/w/d)
Kaufmännischer Sachbearbeiter im Backoffice (m/w/d) 40 Stunden pro Woche •35.000 - 45.000 EUR pro Jahr •Frühester Beginn ab sofort •unbefristete Festanstellung •Mannheim Als Personalberatungsunterneh…
Sales Agent Outbound (m/w/d)
Sales Agent Outbound (m/w/d) Sie haben bereits umfangreiche Erfahrung in der Kundenbetreuung gesammelt, sind kommunikationsstark und lieben es, aktiv auf Menschen zuzugehen? Dann haben wir genau di…