단일 LLM 디자인 에셋 파이프라인
Unified LLM Design Asset Pipeline
Customer Problem Solving Case 5
“다중 비전 스택을 단일 VLM과 OpenCV로 줄이다”
“Collapsing a multi-vision stack into a single VLM plus OpenCV”
YOLO, SAM 같은 다중 비전 모델 조합은 정확하지만 운영 비용과 인프라 종속성이 컸습니다. 이 사례는 단일 VLM과 OpenCV 보정 기법을 결합해 운영 복잡도를 줄인 디자인 에셋 생성 파이프라인을 설명합니다.
1. Need: 도입 배경
1. Need: Background
디자인 에셋 생성 과정에서 객체 탐지, 누끼, 확장 같은 단계를 여러 모델로 나누어 운영하면 개발과 배포 비용이 빠르게 증가했습니다.
2. Problem Definition: 문제 정의
2. Problem Definition: Problem Statement
다중 딥러닝 모델 구조는 GPU 비용과 운영 복잡도가 크고, 특정 모델 장애가 전체 파이프라인 실패로 이어질 위험이 있었습니다.
반면 단일 모델로 줄이면 표현력이나 후처리 품질이 낮아질 수 있다는 trade-off가 존재했습니다.
3. Key View: 접근 방식
3. Key View: Approach
핵심은 모든 품질 문제를 모델 수 증가로 해결하지 않고, VLM의 한계를 수용한 뒤 비전 후처리를 창의적으로 결합하는 것이었습니다.
특히 배경을 네온 그린으로 처리한 뒤 OpenCV로 제거하는 방식을 도입해 단일 모델의 한계를 보완했습니다.
4. Design / Framing: 아키텍처 설계
4. Design / Framing: Architecture Design
입력 이미지를 VLM에 전달해 객체 위치와 배경 분리 방향을 생성한 뒤, 후처리 단계에서 프롬프트 + OpenCV 조합으로 실제 누끼와 확장을 정제했습니다.
결과적으로 GPU 집약적 다중 스택 대신, 단일 모델과 가벼운 이미지 처리 체인으로 운영 패턴을 단순화했습니다.
graph TD
Img([Input Image]) --> VLM[Single VLM];
VLM --> Mask[Prompt-guided Background Plan];
Mask --> CV[OpenCV Post-processing];
CV --> Cutout[Cutout / Expand Asset];
Cutout --> Result([Design-ready Output]);
style Img fill:#f8fafc,stroke:#94a3b8
style VLM fill:#fefce8,stroke:#eab308
style Mask fill:#eff6ff,stroke:#3b82f6
style CV fill:#ecfeff,stroke:#06b6d4
style Cutout fill:#ecfdf5,stroke:#10b981
style Result fill:#ecfdf5,stroke:#10b981
5. Impact: 적용 결과
5. Impact: Results
- ✓운영 복잡도 감소다중 비전 스택 유지 부담을 줄이고 단일 파이프라인 중심으로 정리했습니다.
- ✓인프라 의존 리스크 축소특정 GPU 의존성과 모델 체인 장애 가능성을 낮췄습니다.
- ✓후처리 중심 최적화 가능모델 수를 늘리지 않고도 후처리 계층에서 품질을 제어할 수 있게 했습니다.