Senior AI Data Scientist / Engineer

UKEESS Software House


Дата: 7 годин тому
Місто: Львів
Адреса: вулиця Міртова, 12.
Вид зайнятості: Повна зайнятість
UKEESS Software House

UKEESS Software House шукає Senior AI Data Scientist / Engineer на повний робочий день (або в офісі у Львові, або з можливістю віддаленої співпраці в Україні).

Про проект нашого клієнта:

Це один з найбільших у світі ресурсів по дослідженню сімейної історії та оцифровці ДНК (клієнт із США). За допомогою цього сервісу можна побудувати своє сімейне дерево, дослідити родовід, дізнатись цікаві факти про своїх предків і знайти родичів на базі у понад 60 млрд оцифрованих архівних записів (+ ця цифра постійно росте). Також за допомогою ДНК-аналізу, наприклад, можна знайти родичів, визначити етнічне походження, особливості тілобудови тощо (зараз - це майже 100 визначень по днк-аналізу). Загалом, наш замовник вважається найбільшим у своїй бізнес-ніші!

Про команду:

Ви приєднаєтеся до команди AI Content, динамічної групи, яка працює з Document Understanding. Ви відіграватимете важливу роль у розробці інноваційних АІ моделей, які витягують та впорядковують текстову та графічну інформацію з мільярдів історичних та генеалогічних записів, дозволяючи клієнтам знаходити, ділитися та зв'язуватися зі своєю сімейною історією.

Як учасник команди, ви працюватимете з реалізаціями KB (Бази знань) та RAG (Retrieval Augmented Generation), інтегруючи архітектури, що використовують структуровані SQL бази даних разом із векторними базами даних, що підтримують програми семантичного пошуку та вилучення. Ви працюватимете у команді з обробки даних, а також з інженерними командами, щоб навчати, оптимізувати та розгортати моделі, що сприяють розробці продуктів, успіху клієнтів та створенню контенту в рамках нашого проекту.

Обов'язки:

  • Налаштування структурованих та векторних баз даних: узгодження та синхронізація схем баз даних між структурованими та векторними базами даних.

  • Курування та впорядкування метаданих колекції контенту: підготовка та форматування наданих метаданих колекції контенту для сумісності з визначеними схемами баз даних.

  • Завантаження метаданих колекції контенту: завантаження метаданих колекції з наданих джерел у структуровану базу даних SQL.

  • Генерація вбудовувань: допомога у розробці інструменту/скрипта для генерації вбудовувань зі структурованих даних для заповнення векторної бази даних.

  • Ітеративне вдосконалення: повторення налаштування схеми бази даних, індексів, вбудовувань тощо для підтримки різних запитів і варіантів використання для аналізу завантажених метаданих колекції контенту.

  • Співпраця над розгортанням у хмарі: тісна співпраця з ML Ops та Data Science Engineers для безперешкодного розгортання наборів даних, truth sets, моделей та пайплайнів для навчання та висновків у хмарних середовищах.

  • Ефективна комунікація: чітка та впевнена презентація своїх висновків, результатів і рішень технічній та нетехнічній аудиторії, включаючи команди, стейкхолдерів і керівників.

Вимоги:

  • 5+ років досвіду роботи в галузі Data Science

  • Комерційний досвід роботи з LLM у продакшені, RAG-архітектурою та агентними системами

  • Експертиза у зборі, організації, куруванні та форматуванні даних для заповнення баз даних SQL.

  • Досвід роботи з базами даних SQL, включаючи налаштування схем та індексів для оптимізації ефективних запитів. 

  • Розуміння та досвід із генерацією вбудовування та використанням векторних баз даних для семантичного пошуку та отримання. 

  • Поглиблені знання і досвід роботи з Python та відповідними інструментами та бібліотеками

  • Практичний досвід роботи з хмарними сервісами AWS (наприклад, Amazon SageMaker, EC2, S3, AWS Lambda).

  • Англійська - вище середнього рівня (розмовна і письмо).

Буде перевагою:

  • Знання і досвід хмарних платформ і пов'язаних АІ/ML-сервісів, таких як Google GCP Gemini API, Vertex AI, Azure тощо.

  • Глибокі знання та досвід роботи з LightLLM
  • Комерційний досвід роботи з Terraform або CloudFormation

  • Досвід роботи з агентними інструментами веб-скрейпінгу

Що ви здобудете у цій ролі:

  • Менторство та професійний ріст: підтримка від досвідчених Data Scientist-ів і робота над реальними AI-проектами. Можливість розширити свої знання та професійну мережу в рамках культури співпраці.

  • Співпраця та вплив: можливість долучитися до команди топових фахівців, що формує інноваційні підходи у сфері Document Understanding.

  • Інновації та мета: ваш внесок допоможе мільйонам користувачів по всьому світу краще пізнати своє коріння.

Що ми пропонуємо новому колезі?

  • Конкурентоспроможна компенсація (на основі ринкових даних, але також залежить від технічного рівня кандидата)

  • Гнучкий графік роботи

  • Щорічна оплачувана відпустка

  • Безкоштовні уроки англійської (онлайн)

  • Медичне страхування або дві альтернативи на вибір

  • Індивідуальний плани для професійного та особистісного розвитку

  • Відсутність бюрократії та мікро менеджменту

  • Сучасні енергозабезпечені комфортні офіси у Львові (зона барбекю, кухні, кімнати відпочинку та ін.)

  • Парковка на території та зарядна станція для електромобілів

  • Закордонні відрядження (після війни)

  • Корпоративні подарунки, свята та розваги

  • Спортивні активності: настільний теніс, футбол, воркаут

Надішліть нам своє резюме і давайте познайомимося! ;)

-------------------------------------------------------------------------------------------------------------------

The UKEESS Software House team is currently looking for a Senior AI Data Scientist / Engineer to join our team for a full-time position (remotely in Ukraine or in Lviv's office).

About the Customer and the Project:

Our customer is the world's largest DNA network, based in the USA. This presents a unique opportunity to work with more than 60 billion digitized global historical records, 100 million family trees, and 18+ million people in their growing database. Our customers help people discover their family stories and gain actionable insights about their health and wellness. 

About the team:

You will join the AI Content team, a dynamic group at the forefront of Document Understanding. You'll play a vital role in developing innovative AI models that extract and organize text and image information from billions of historical and genealogical records, enabling customers to discover, share, and connect with their family history. 

As a member of the team, you will work with KB (Knowledge Base) and RAG (Retrieval Augmented Generation) implementations, integrating architectures leveraging SQL-structured databases along with vector databases supporting semantic search and retrieval applications. You will work with a dedicated mentor from the data science team, as well as engineering teams, to train, optimize, and deploy models that promote product development, customer success, and content creation across our project.

What you will do:

  • Configure structured and vector databases: Align and sync database schemas across structured and vector databases 

  • Curate and organize content collection metadata: Prepare and format provided content collection metadata to be compatible with defined database schemas 

  • Ingest content collection metadata:  Ingest collection metadata from provided sources into a structured SQL database.

  • Embeddings generation: Help develop a tool/script to generate embeddings from the structured data to populate the vector database.

  • Iterative improvement: Iterate on adjusting the database schema, indexes, embeddings, etc., to support various queries and use cases for analyzing the ingested content collection metadata

  • Collaborate on Cloud Deployment: Partner closely with ML Ops and Data Science Engineers to seamlessly deploy datasets, truth sets, models, and pipelines for training and inference in cloud environments.

  • Communicate Insights Effectively: Clearly and confidently present your findings, deliverables, and proposed solutions to technical and non-technical audiences, including teams, stakeholders, and executives.

Requirements:

  • 5+ years of experience in Data Science

  • Strong hands-on commercial experience with LLMs in production, RAG architecture, and agentic systems

  • Expertise with data collection, organization, curation, and formatting to populate SQL databases. 

  • Experience with SQL databases, including adjusting schemas and indices to optimize for efficient queries. 

  • Familiar with embedding generation and use of vector databases for semantic search and retrieval. 

  • Strong proficiency and experience with Python and relevant tools and libraries

  • Practical experience with cloud platform AWS (e.g. Amazon SageMaker, EC2, S3, AWS Lambda).

  • English: Upper-intermediate at least (both spoken and written)

It will be a plus:

  • Knowledge and experience with cloud platforms and related AI/ML services such as Google GCP Gemini API, Vertex AI, Azure, etc.  

  • Strong knowledge and experience with LightLLM

  • Commercial experience with Terraform or CloudFormation

  • Experience with agentic web scraping tools

What You’ll Gain

  • Mentorship & Growth: Learn from experienced Data Scientists while tackling meaningful, real-world AI projects, expanding your knowledge and professional network within a collaborative culture. 

  • Collaboration & Impact: Work alongside top industry professionals and help shape the tools that bring family history to life for millions of users.

  • Innovation & Purpose: Join a team at the forefront of applying AI to historical data - where every model you build helps preserve human stories.

What do we offer our new colleague?

  • Competitive compensation (based on market data, but also depending on the technical level of the candidate)

  • Flexible work schedule

  • 3 health packages to choose from

  • Annual paid vacation and state holiday celebration

  • Free English classes (online)

  • Individual approach to professional growth

  • Lack of bureaucracy and micromanagement

  • Modern, comfortable office facilities (a barbecue zone, kitchens, lounge rooms, coffee machines, etc.)

  • Foreign business trips (after the war)

  • On-site parking lot and charge station for Electric Cars

  • Corporate gifts, celebrations, and fun activities

  • Sports activities: ping-pong, soccer, work-out

Suppose you have a passion for solving challenging problems, building scalable, robust systems, love working with the latest technologies in a fast-paced, flexible environment, and are excited about the prospect of having a significant impact on products with more than 3 million paying subscribers.

In that case, we want to talk to you! ;-)

Як відгукнутися?

Щоб відгукнутися на цю вакансію, вам необхідно авторизуватися на нашому сайті. Якщо у вас ще немає облікового запису, будь ласка, зареєструйтесь.

Розмістити резюме

Схожі вакансії

Менеджер з продажу

Baziuk Family Gold Masters, Львів,
1 день тому
Ти — менеджер, який з продажем на «Ти»? Ми шукаємо того, хто з першого контакту допоможе клієнту розпочати його унікальну історію кохання. Family Gold Masters — це ювелірний дім, що спеціалізується на створенні індивідуальних прикрас із поєднанням сучасних технологій та ручної роботи майстрів. Ти станеш частиною команди, якщо хочеш працювати із преміум-сегментом та готовий підтримувати високі стандарти у комунікації. Наші...
Baziuk Family Gold Masters

Senior DevOps Engineer IRC278708

GlobalLogic, Львів,
1 день тому
Description We are looking for an R&D Senior Software Developer to drive innovation and solution development in Grid Automation. In this role, you will collaborate with dynamic global technology teams with niche competencies and cutting-edge technology. You will develop the power grids of the future, creating software that is used in crucial infrastructure and in real-time. The product is designed...
GlobalLogic

Директор (агенція з працевлаштування)

ВАЛ-МАР, ТзОВ , Львів,
70 000 ₴ - 100 000 ₴
2 дні тому
Агенція з працевлаштування оголошує конкурс на посаду Директора. Шукаємо професіонала з досвідом управлінської роботи, який готовий розвивати компанію, будувати ефективні бізнес-процеси та відповідати за стратегічний розвиток. Основні обов’язки:     • Організація та контроль діяльності агенції.     •  Розвиток співпраці з іноземними та українськими партнерами.     • Управління командою, постановка цілей та контроль їх виконання.    • Розробка та впровадження стратегій зростання компанії.     • Представництво...
ВАЛ-МАР, ТзОВ