#

Play Video

#

# #
AI сегментація зображень SAM2 + LaMa – інтерфейс видалення об`єктів
# # # # # #

AI-інструмент сегментації зображень (SAM2 + LaMa)

#

В рамках проєкту розроблено веб-інструмент для точного виділення об'єктів на зображеннях з подальшим видаленням та видаленням зі сцени. Рішення орієнтоване на практичні завдання: підготовка зображень, автоматизація контенту та використання інших систем (конфігуратори, каталоги, генерація).

Користувач виконує одну дію – виділяє область навколо об'єкта. Виділення може бути як прямокутним, і довільної форми (через точки).

Вся подальша обробка – сегментація, очищення маски, вилучення об'єкта та відновлення фону – відбувається автоматично на backend.

# #
demo-app-developer-1
Технології
vue
html
css
canvas
sam-2
lama
Видалення об`єкта з фото та прозоре тло – AI background removal

Завдання проєкту

Потрібно було реалізувати не просто вирізання об'єкта, а повний цикл роботи зі сценою:

  • точна сегментація без ручної розмітки
  • отримання pixel-level маски
  • вилучення об'єкта без втрати геометрії
  • видалення об'єкта з відновленням фону
  • повернення готових результатів без додаткової обробки

Ключова вимога – мінімальний UX (без пензлів, без ручної корекції) за збереження точності результату.

Практичне застосування та реальні кейси

  • На практиці цей інструмент використовується не як окремий редактор, а як частина робочих процесів – там, де важливо швидко та точно працювати із зображеннями.
  • E-commerce (товари та каталоги)
    Фото товару → виділення → система автоматично вирізує об'єкт та прибирає фон.
    👉 На виході – готове зображення для картки без ручної обробки.
  • Інтер'єри та нерухомість
    Видалення меблів, предметів чи візуального шуму зі сцени.
    👉 Дозволяє показувати “чистий простір” та готувати зображення до продажу чи візуалізації.
  • Вилучення людей з фото
    З фотографій автоматично забираються перехожі, клієнти, співробітники чи випадкові люди у кадрі.
    👉 Використовується для:
    — очищення інтер'єрів та вітрин
    — підготовки фото для сайтів та каталогів
    — маркетингових матеріалів без "шуму"
  • Конфігуратори (двері, меблі, товари)
    Об'єкт виділяється як один шар → далі можна змінювати колір, матеріали, текстури.
    👉 Це основа для інтерактивних конфігураторів.
  • Контент та маркетинг
    Об'єкт видобувається та використовується у різних креативах, банерах, лендингах.
    👉 Швидке виробництво візуалу без фотосесій.
  • Масова обробка зображень
    Робота з каталогами та великими обсягами контенту.
    👉 Суттєве скорочення часу та витрат.
Сегментація об`єкта та людини на фото – AI вилучення об`єктів

UX / сценарій користувача

Flow максимально спрощений:

  • Користувач завантажує зображення
  • Виділяє об'єкт:
    — або прямокутником (bounding box)
    — або довільною формою через точки
  • Натискає «Обробити»
  • Отримує результат

Чому такий підхід

  • можна швидко виділити об'єкт через bbox
  • при необхідності – точно задати межі через точки
  • підходить для запуску SAM
  • знижує поріг входу та дає гнучкість для складних випадків

Як працює система

Коли користувач завантажує зображення та виділяє об'єкт прямокутником, на backend йде дві речі:

  • саме зображення
  • координати виділеної області

Технічно це виглядає так:

{

"image": file,

"bbox": [x1, y1, x2, y2]

}

Тобто система отримує не «готовий об'єкт», а просто підказку – де його шукати приблизно

ШІ інструмент виділення об`єкта – вибір області сегментації

Що відбувається далі (pipeline)

Далі запускається послідовне оброблення зображення. Важливо: це не один крок, а кілька етапів, кожен із яких вирішує своє завдання.

1. Підготовка зображення

Спочатку backend наводить дані у нормальний вигляд:

  • зображення декодується
  • наводиться до потрібного формату та розміру
  • перевіряється, що виділення користувача коректне

Це потрібно, щоб модель далі працювала стабільно і без помилок.

2. Визначення об'єкта (сегментація)

Далі підключається модель SAM2.

Що вона робить за фактом:

  • дивиться на область, яку виділив користувач
  • «розуміє», де в ній реальний об'єкт
  • відокремлює об'єкт від фону

На виході виходить точна маска, де:

  • біле – це об'єкт
  • чорне – це все інше

Важливо:
це не просто прямокутник, а точне виділення за формою – з урахуванням усіх згинів, деталей та контурів.

Маска сегментації об`єкта – результат AI обробки зображення

3. Очищення маски

Після моделі маска не ідеальна, тому її допрацьовують:

  • забираються дрібні «сміттєві» пікселі
  • згладжуються краї
  • перевіряється, щоб об'єкт був цілісним

Навіщо це потрібно?
якщо цього не зробити, об'єкт буде з рваними краями або зайвими шматками фону.

Точна маска об`єкта після сегментації SAM2

4. Вирізання об'єкта

Тепер, коли є точна маска, об'єкт акуратно відокремлюється від зображення.

Технічно це робиться так:

object = image * mask

На практиці це означає:

  • залишається лише сам об'єкт
  • фон стає прозорим

Що важливо:

  • розмір об'єкта не змінюється
  • пропорції зберігаються
  • становище не «з'їжджає»

На виході виходить готовий PNG, який можна використовувати.

Вирізаний об`єкт із прозорим фоном – результат AI

5. Видалення об'єкта зі сцени

Паралельно система робить другу операцію – прибирає об'єкт із вихідного зображення.

Створюється "порожнє місце" там, де був об'єкт:

hole = image - mask

Але просто видалити – замало. Потрібно відновити тло.

Видалення об`єктів та людей з фото – AI відновлення фону

6. Відновлення тла (inpainting)

Для цього використовується модель LaMa.

Що вона робить:

  • аналізує, що знаходиться навколо віддаленого об'єкту
  • «Домальовує» недостатню ділянку
  • відновлює текстуру

Найкраще це працює на:

  • стінах
  • підлозі
  • однотипних текстурах

В результаті не залишається "дірки" – зображення виглядає цілісним.

Чисте тло після видалення об`єкта – AI очищення зображення

7. Що отримує користувач

У результаті система повертає відразу два результати:

{

"original": "...",

"object": "...",

"clean": "..."

}

Де:

  • object – вирізаний об'єкт без фону
  • clean – зображення без цього об'єкту

І це вже готові файли, які можна використати далі без доопрацювання.

Результат AI сегментації – поділ об`єкта та фону

Як це влаштовано технічно

Frontend

  • Vue 3
  • Canvas

Canvas використовується не як основний рендеринг, а як допоміжний інструмент:

  • для виділення області на зображенні
  • для фіксації координат (точок), вибраних користувачем
  • для спрощення передачі цих даних у обробку

У цьому випадку Canvas не працює із самим зображенням безпосередньо, а служить шаром взаємодії – збирає точки, якими визначається область інтересу.

Як це працює

  1. Користувач виділяє область на зображенні
  2. Через Canvas фіксуються координати обраної зони
  3. Ці дані передаються в модель сегментації ( SAM2 )
  4. Модель повертає маску об'єкту
  5. Маска накладається поверх оригінального зображення другим шаром
  6. В результаті, користувач бачить контур/область, яку визначила модель

Backend

  • Python
  • відповідає за весь pipeline
  • обробляє зображення
  • викликає AI-моделі

AI-частина

  • SAM 2 – виділяє об'єкт
  • LaMa – відновлює фон

Весь процес розбитий на етапи:

  • сегментація
  • вилучення
  • відновлення

Це важливо, тому що:

  • можна міняти моделі
  • можна масштабувати систему
  • можна покращувати окремі частини
Загрузка изображения в AI инструмент сегментации
Сегментация мебели в интерьере – точечное AI выделение объекта
Интерфейс уточнения сегментации – редактирование маски

Що важливо у реалізації

  1. Це не просто "вирізати картинку"
    Система реально розуміє де об'єкт, а не просто обрізає прямокутник.
  2. Об'єкт зберігає геометрію
    Його можна вставити або використовувати далі без спотворень.
  3. Мінімум дій від користувача
    Не потрібно обводити контур – достатньо виділити область.
  4. Працює без навчання під завдання
    Не потрібно збирати датасет під кожен тип товару.

Продуктивність

Залежить від:

  • розміру зображення
  • складності об'єкта
  • завантаженості сервера

Як це виглядає насправді:

  • прості об'єкти – швидко
  • складні сцени – трохи довше, але стабільно

Обмеження

Є ситуації, де результат може бути гіршим:

  • об'єкт зливається з фоном (низький контраст)
  • кілька об'єктів перетинаються
  • дуже складні текстури (дрібні деталі)

Як можна використовувати інструмент

Поточна версія вирішує базове завдання – точне виділення, вилучення та очищення сцени. Але архітектура спочатку закладена те щоб цей інструмент був кінцевим продуктом, а ядром інших рішень.

Практичне використання

  1. Підготовка контенту для e-commerce
    — Автоматична вирізка товару з фото
    — Підготовка зображень для карток
    — Очищення фону без дизайнера
  2. Генерація каталогу
    — Один вихідник → різні варіанти подачі
    — Перенесення об'єкта на інші фони
    — Складання візуалів без фотосесій
  3. Очищення сцен
    — Видалення зайвих об'єктів (меблі, предмети)
    — Підготовка «чистих» інтер'єрів
    — робота з real-life фото
  4. Основа для конфігураторів
    - Виділений об'єкт можна використовувати як шар
    - далі – міняти колір, матеріали, текстури
    - Інтеграція з 2D/3D конфігураторами
  5. Підготовка даних для AI
    — Сегментовані об'єкти → вхід для генеративних моделей
    — Навчання / fine-tuning
    — Створення датасетів
Видалення об`єкта з фото – порівняння до та після

Як можна доопрацьовувати

Архітектура дозволяє збільшувати функціональність без переписування системи.

Auto-detection (без bbox)

Наразі користувач задає область вручну.
Наступний крок – автоматичне визначення об'єктів на сцені:

  • список об'єктів
  • вибір кліком
  • робота як із «розумною сценою»

Batch processing

Обробка не одного зображення, а пачки:

  • завантаження каталогу
  • масова сегментація
  • автоматичне вивантаження

Актуально для e-commerce та production.

Інтеграція з генеративними моделями

Після сегментації можна:

  • міняти матеріали та кольори
  • генерувати варіації
  • створювати нові сцени

Тобто перетворювати інструмент на повноцінний AI-конфігуратор.

Робота з 3D/depth

Додавання depth-аналізу:

  • розуміння глибини сцени
  • коректна вставка об'єктів
  • перехід до 3D-конфігурації

Інтеграція у бізнес-процеси

— CRM (передача зображень)
— CMS (керування контентом)
— e-commerce (картки товарів)

Інструмент стає частиною pipeline, а не окремим сервісом.

Поліпшення точності

— Дообробка масок
— Гібридні моделі сегментації
— Адаптація під конкретні категорії (меблі, одяг і т.д.)

Інтеграція AI сегментації - вирізування автомобіля

Результат

Реалізовано інструмент, який:

  • точно виділяє об'єкт без ручної розмітки
  • витягує його без втрати геометрії
  • видаляє об'єкт із коректним відновленням фону
  • повертає готові дані для подальшого використання

По суті, це базовий шар для будь-яких систем, де потрібно працювати із зображенням як із структурованою сценою, а не як із «картинкою».

Бажаєте впровадити такий інструмент?

Розробимо рішення під ваші завдання: від базової сегментації до повної інтеграції до сайту, CRM або e-commerce.

Покажемо, як це працюватиме саме у вашому кейсі та які завдання закриє.

👉 Залишіть заявку – розберемо завдання та запропонуємо реалізацію під ваш бізнес

Привіт!👋 Зв'яжіться з нами 😀