Kiro Building Note 17

Kiro Building Note 17

v1.0을 전달드렸던 고객님께 11/3에 v1.3을 다시 가져다드리고 피드백을 받았다. 현재 100페이지마다 한번씩 테이프를 교체해줘야 하는데 이 부분에서의 번거로움과 가아끔씩 오동작하는 경우, 가아끔씩 종이가 안 떨어지는 경우, 웹이 가끔씩 터지는 경우 제외하고는 꽤나 만족스럽게 사용하셨다. 예전 회사 동료 분이라 친해서 이거 키로 전달드리고 키로 돌려놓고 같이 F1 시뮬레이션 게임하고 중간중간 잘 돌아가고 있는지 확인하고 다시 게임하고 그랬다. 가아끔씩 오동작하는 경우와 웹이 가끔씩 터지는 경우는 현재는 다 해결된 상태이다. 리프팅 내구성을 증가하는 것이 남은 11월에 제일 핵심적으로 해결해야 할 문제로 보인다.

이외에 오늘 v1.4 중간 버전을 다른 고객님께 1대 더 배송하고 왔다. 이번 버전 중간 정리!

웹 최적화

문제: 어느 정도 스캔하고 나면 웹이 계속 껌뻑거리고 잠시 후에 죽어버렸음

원인: 300ms마다 1300x1300 이미지 50장씩 폴링해오고 있어서

해결:

  1. 썸네일과 원본 분리
  2. 썸네일, 원본 이미지 API 만들고 폴링할 땐 API URL만
  3. 웹에서 이미지 API URL 기준으로 캐싱

이미지 캐싱하니까 아주 여유롭고 빠르고 버벅임이 없다.

LED

문제: 기기가 인터넷 연결되면 웹에서 기기 상태를 알 수 있지만 인터넷 연결되기 전까지 상태 파악 불가

해결: LED로 현재 상태 알려주기

코드 색상 패턴 의미
BOOTING 흰색 느린 숨쉬기(2s) 시스템 기동 중
WIFI_QR_WAITING 파랑 느린 점멸(0.8s) QR 대기
WIFI_CONNECTING 파랑 빠른 점멸(0.2s) 연결 시도
INTERNET_READY 하늘색 브레스(1.5s) 인터넷 OK
SERVER_CONNECTING 하늘색 빠른 점멸(0.2s) 서버 연결
CONNECTED 초록 고정 대기 / 준비 완료
DISCONNECTED 주황빛 빨강 느린 점멸(0.8s) 연결 끊김
RUNNING 초록 브레스(1.2s) 스캔 중
PAUSED 노랑 느린 점멸(0.8s) 일시정지
ERROR 빨강 3회 점멸 후 정지 오류
SLEEP 흰색 매우 느린 숨쉬기(3s) 슬립 상태

이 블로그 글 맨 위 사진에서 헤드를 보면 초록색 불이 들어와있는 모습을 알 수 있다.

Wifi 연결 속도 향상

문제: Wifi 연결할 때 2-3분 이상씩 걸림

원인:

이런 식으로 화면이 밝게 보여 인식이 빠르게 안되는 거였음.

해결: QR 대기 상태일 때의 카메라 셋팅을 조절하여 핸드폰 화면에서도 QR 인식 잘 되도록 함.

OCR (Document Layout Analysis)

문제:

  1. 기존의 PaddleOCR + GPT-5 mini 파이프라인이 느리고, OCR이 정확하지 않고, 레이아웃 파악 불가능함 (레이아웃 파악 ⇒ 이미지나 차트 가져오기)
  2. g4dn.xlarge로 OCR 모델 서빙해서 사용하기에 가격이 비싸고 스케일러블하지 않음

결론: API를 제공하고 한글 OCR이 잘 되고 layout parse도 되는 서비스를 찾아보자!

해결: Upstage Document Parse 사용

최근 sota layout parser들은 거의 다 오픈소스라 서빙을 해야만 했고 Google Document AI는 성능이 별로였다. Upstage Document Parse 짱. 유니콘 될 만하다!

글자는 글자대로 HTML로 바꿔주고, 그림은 그대로 캡처 따서 보여주는 모습

Rail

문제: 가끔씩 vpressarm slider가 뒤로 안 빠지는 문제

원인: 앞으로 쭉 전진할 때 책에 막히면 위로 들리는데 들리고 나서 바퀴가 레일을 제대로 못 찾아서

해결: 우측 레일 좀 더 높이고, 가운데 홀더 위쪽 갭 줄여서 vpressarm housing 자체가 안 들리도록

v1.4 마무리 TODO

  1. OCR을 API로 변경했으니 g4dn.xlarge에서 t2.small로 서버 다운그레이드
  2. 리프팅 내구성 증가
    1. 접착력이 안 떨어지는 재료 / 자동 교체 시스템 / 진공 흡착 / 정전기 흡착
    2. 어떤 것이 제일 현실적일까!
  3. 다양한 형태로 export
  4. 역스캔 UX 향상

1, 3, 4는 하면 되는 태스크이고 2번이 제일 중요하다. 이번 주말 내로 2번 어떻게든 다 하고 싶다. 최소한 책 1권은 한번에 할 수 있을 정도로!

마무리 잘 하고 이번 달에 제발 20대만 팔아보자...!