Сергій П.
Senior Data Engineer
Інформація
Працевлаштування
Експертиза
Місцезнаходження
Київ, Україна
Досвід роботи
6+ років
Портфоліо
Professional Summary
Senior Data Engineer з досвідом побудови data pipelines та інфраструктури даних для аналітики та AI-систем. Спеціалізується на зборі, обробці та підготовці даних з різних джерел, проєктуванні data lakes та data warehouses, а також забезпеченні стабільної доставки даних до ML та AI-продуктів.
Фокусується на створенні масштабованих та відмовостійких data-систем, які забезпечують бізнес актуальними та структурованими даними для прийняття рішень та навчання моделей.
Ключові навички
Data Engineering
- побудова ETL / ELT pipelines
- batch та streaming обробка даних
- інтеграція джерел даних (API, бази, логі)
- підготовка training datasets для ML
Big Data
- Apache Spark / PySpark
- розподілена обробка даних
- оптимізація обчислень
Data Storage
- проєктування data lakes
- побудова data warehouses
- робота з BigQuery, Snowflake, Redshift
Orchestration & Streaming
- Apache Airflow
- Kafka
- автоматизація data pipelines
Інфраструктура
- AWS/GCP
- Docker
- побудова scalable data architecture
Досвід роботи
AVADA MEDIA
Senior Data Engineer
- проєктування та реалізація data pipelines для AI та аналітики;
- збір даних із CRM, API, логів та зовнішніх сервісів;
- обробка та очищення даних;
- побудова data lakes та аналітичних сховищ;
- підготовка datasets для ML моделей;
- налаштування batch та streaming процесів;
- оптимізація продуктивності обробки даних;
- інтеграція data-інфраструктури до AI-проєктів.
Ключові проєкти
- збір та обробка аудіо та текстових даних
- підготовка даних для аналізу дзвінків
Результат: стабільний потік даних для AI-аналітики
AI-агент для аналізу пропозицій постачальників
- вилучення даних із документів
- структурування інформації
Результат: підготовлені datasets для AI аналізу
- обробка голосових даних
- інтеграція потоків даних у систему
Результат: автоматизація обробки дзвінків
AI-агент для генерації комерційних пропозицій
- об'єднання даних з CRM, документів та баз
- підготовка даних для генерації
Результат: прискорення бізнес-процесів
Освіта
Бакалавр комп'ютерних наук
Сильні сторони
- Проєктування data architecture
- Робота з великими обсягами даних
- Оптимізація pipeline та інфраструктури
- Розуміння AI та ML процесів
- Стабільні та масштабовані рішення
- Фокус на бізнес-результаті