Lead/Staff AI Runtime Engineer (Ukraine)
Capgemini Engineering
At Capgemini Engineering, the world leader in engineering services, we bring together a global team of engineers, scientists, and architects to help the world’s most innovative companies unleash their potential. From autonomous cars to life-saving robots, our digital and software technology experts think outside the box as they provide unique R&D and engineering services across all industries. Join us for a career full of opportunities. Where you can make a difference. Where no two days are the same.
Your Client
Our client is at the forefront of revolutionizing AI computing by re-engineering infrastructure at the system level. Its architecture, combined with sophisticated software intelligence, abstraction, and an orchestration layer, enables developers to leverage a diverse array of compute resources, achieving efficient and reliable computing at a fraction of the cost. Founded by industry veterans from Nvidia, Apple, Tesla, Intel, and Zoox, it's shaping the future of AI.
As the Lead/Staff AI Runtime Engineer, you’ll play a pivotal role in the design, development, and optimization of the core runtime infrastructure powering distributed training and deployment of large AI models. This is a hands-on leadership role - ideal for a systems-minded software engineer who thrives at the intersection of AI workloads, runtimes, and performance-critical infrastructure.
Your Role
Your Client
Our client is at the forefront of revolutionizing AI computing by re-engineering infrastructure at the system level. Its architecture, combined with sophisticated software intelligence, abstraction, and an orchestration layer, enables developers to leverage a diverse array of compute resources, achieving efficient and reliable computing at a fraction of the cost. Founded by industry veterans from Nvidia, Apple, Tesla, Intel, and Zoox, it's shaping the future of AI.
As the Lead/Staff AI Runtime Engineer, you’ll play a pivotal role in the design, development, and optimization of the core runtime infrastructure powering distributed training and deployment of large AI models. This is a hands-on leadership role - ideal for a systems-minded software engineer who thrives at the intersection of AI workloads, runtimes, and performance-critical infrastructure.
Your Role
- Own the core runtime architecture supporting AI training and inference at scale.
- Design resilient and elastic runtime features (for example, dynamic node scaling and job recovery) within the custom PyTorch-based stack.
- Optimize distributed training reliability, orchestration, and job-level fault tolerance.
- Profile and enhance low-level system performance across training and inference pipelines.
- Improve packaging, deployment, and integration of customer models in production environments.
- Design and maintain libraries and services that support the full model lifecycle: training, checkpointing, fault recovery, packaging, and deployment.
- Implement observability hooks, diagnostics, and resilience mechanisms for deep-learning workloads.
- Champion best practices in CI/CD, testing, and software quality across the AI Runtime stack.
- Work cross-functionally with Research, Infrastructure, and Product teams to align runtime development with customer and platform needs.
- Guide technical discussions, mentor junior engineers, and help scale the AI Runtime team’s capabilities.
- 8+ years of experience in systems or software engineering, with deep exposure to AI runtime, distributed systems, or compiler/runtime interaction.
- Experience in delivering PaaS services.
- Proven experience optimizing and scaling deep-learning runtimes (such as PyTorch, TensorFlow, or JAX) for large-scale training or inference.
- Strong programming skills in Python and C++; experience with Go or Rust is a plus.
- Familiarity with distributed training frameworks, low-level performance tuning, and resource orchestration.
- Experience working with multi-GPU, multi-node, or cloud-native AI workloads.
- Solid understanding of containerized workloads, job scheduling, and failure recovery in production environments.
- Contributions to PyTorch internals or open-source deep learning infrastructure projects.
- Intel OpenVINO
- Familiarity with LLM training pipelines, checkpointing, or elastic training orchestration.
- Experience with Kubernetes, Ray, TorchElastic, or custom AI job orchestrators.
- Background in systems research, compilers, or runtime architecture for high-performance computing (HPC) or machine learning.
- Start-up experience.
- Ability to travel to the EU.
- We care about all our employees and want them to feel as comfortable as possible. That's why we offer them health insurance from the first days, regardless of the probationary period.
- The gift from the company - Christmas holidays from 25 December to 31 December.
- Сooperation with Superhumans center and Veteran HUB. Capgemini Engineering has supported the launch of psychological rehabilitation department of Superhumans. Our team also donated over UAH 500 000 prosthetics for three Ukrainian defenders. Currently, we support psychological counseling provided by the Veteran Hub, and we have implemented an internal policy making the company friendly to military and veterans with the assistance of the Hub.
Як відгукнутися?
Щоб відгукнутися на цю вакансію, вам необхідно авторизуватися на нашому сайті. Якщо у вас ще немає облікового запису, будь ласка, зареєструйтесь.
Розмістити резюмеСхожі вакансії
Менеджер з продажу, продавець-консультант в магазин мобільних аксесуарів
Заказуй, інтернет-магазин мобільних аксесуарів,
Київ,
2 години тому
Наш магазин мобільних аксесуарів у свій колектив в місті Київ, у зв’язку з розширенням торгової мережі, оголошує про відкриття вакансії на посаду продавця-консультанта, менеджера з продажу. ОБОВ’ЯЗКИ : Продаж мобільних аксесуарів: чохли, захисне скло, зарядки, навушники, Power bank, автотримачі та багато іншого… Поклейка (установка) захисного скла і плівки. Консультування клієнтів. Викладка та контроль товарів на вітрині. Контроль чистоти у магазині....
Менеджер з логістики міжнародних перевезень (власний парк)
Логістик Профсервіс,
Київ,
3 години тому
Опис вакансії Динамічно розвиваюча транспортна компанія ТОВ «Логістик Профсервіс» — що спеціалізується на перевезенні продуктів харчування власним автопарком, який налічує понад 80 автомобілів від 5 т до 20 т (DAF, SCANIA, RENAULT, VOLVO). Запрошує у свою команду диспетчера-логіста з міжнародних перевезень на власний автопарк. Ми пропонуємо: Офіційне працевлаштування (оплачувані відпустки, лікарняні та відрядження); Оплата праці — ставка+бонуси; Робочий день з...
Сестра Медична (Академмістечко)
НІКОЛАБ, Лабораторія / NIKOLAB,
Київ,
22 000 ₴
-
28 000 ₴
5 годин тому
Медична лабораторія «NIKOLAB» у зв’язку з розширенням запрошує на роботу Сестру медичну Ніколаб — це мережа медичних лабораторій, яка заслужила довіру клієнтів з 2014 року завдяки кваліфікації та згуртованості нашого колективу. Нашу команду об'єднує єдина мета, єдині пріоритети та прагнення. Наші співробітники — це наша гордість. Кожен з нас, справжній професіонал, який пройшов спеціальне навчання та постійно розвивається та вдосконалює...