왜 지연 예산이 중요한가
많은 파일럿 프로젝트는 데모 단계에서는 좋은 성능을 보이지만, 실제 라인에 들어가면 실패합니다.
이유는 종단 간 지연을 예산 개념으로 설계하지 않았기 때문입니다.
검사 라인에서는 모델 자체가 빠르더라도, 카메라 I/O, 프레임 변환, PLC 전달까지 포함하면 트리거 윈도를 놓칠 수 있습니다.
실무적인 예산 모델
먼저 "프레임 캡처 후 120ms 이내 판정 완료"와 같은 목표를 정한 뒤, 그 목표를 측정 가능한 단계로 나눕니다.
- 캡처 및 전송: 카메라와 버스 전송 시간
- 전처리: 리사이즈, 정규화, ROI 크롭
- 추론: 모델 실행 시간
- 후처리: 임계값 처리, NMS, 신뢰도 판단
- 출력 전달: 디지털 I/O, 필드버스 또는 API 응답
각 단계를 작은 여유분을 포함한 고정 한계치로 관리해야 합니다.
그래야 카메라를 바꾸거나 모델을 교체하거나 배치 설정을 수정해도 통합팀이 같은 기준으로 움직일 수 있습니다.
산업 현장에서 자주 보이는 병목
- 불안정한 카메라 노출 설정이 전처리 편차를 키움
- 공유 스토리지의 경쟁 프로세스가 랜덤 I/O 지연을 만듦
- 실험실 이미지와 공장 이미지 간 드라이버 불일치가 가속 동작을 바꿈
- watchdog과 재시도 로직이 없으면 장기 꼬리 지연이 커짐
배포 체크리스트
- 파일럿 승인 전에 소프트웨어와 드라이버 버전을 고정합니다.
- 평균 지연만 보지 말고 95퍼센타일과 99퍼센타일도 기록합니다.
- 추론이 SLA 윈도를 놓쳤을 때의 fallback 동작을 정의합니다.
- 성능 로그와 함께 열 상태도 함께 수집합니다.
마무리
지연 예산은 단순히 모델 최적화 문제가 아닙니다.
이는 비전팀, 제어팀, 플랫폼팀 사이의 시스템 계약입니다.
이 계약을 초기에 명확히 만드는 팀은 보통 양산 전개 과정의 마찰을 줄이고 안정화 기간도 더 짧게 가져갑니다.
