Kiro Building Note - 1

Timeline

매달 15번 이상의 고객 인터뷰 진행

  • ~7/7 제품 가치 검증
  • ~7/31 1만원에 MVP 1개 판매 - MVP 제작
  • ~8/31 5만원에 10개 판매 - 성능 고도화
  • ~9/30 5만원에 100개 판매 - 로봇 수제 생산 & 마케팅
  • ~10/31 5만원에 1,000개 판매 - 로봇 공장 만들기
  • ~11/31 10만원에 1,000개 판매 - 성능 고도화

딱 5개월 해서 1억 벌고 군대 가자! 글로벌은 다녀와서 하자. 택배 보내는 거 글로벌로 나갈려면 어지러울 것 같다.

Algorithm


✅ 1. 페이지 정방향 넘김 알고리즘 (Forward Page Turning Algorithm)

📌 목적

한 페이지씩 안정적으로 정방향(오른쪽 → 왼쪽 또는 반대)으로 넘김

⚙️ 핵심 구성 요소

  • 페이지 가장자리 탐지 (Edge Detection): 카메라/센서를 활용해 현재 페이지의 모서리 위치 파악
  • 흡착 위치 제어: 진공 패드나 그리퍼가 정확한 위치에 흡착
  • 회전 궤적 생성 (Trajectory Planning): 페이지가 찢어지지 않도록 부드러운 궤적 생성 (Bezier 곡선 등)
  • 속도/토크 제어: 종이 강도에 맞춘 속도 설정 및 힘 제어

🛠️ 기술 적용

  • OpenCV 기반 엣지 디텍션
  • inverse kinematics + servo control
  • 페이지 두께에 따른 force profile 조절

✅ 2. 정상 페이지 넘김 판별 알고리즘 (Page Turn Validation)

📌 목적

한 장만 정확히 넘겼는지 자동 검출

🔍 주요 방법

  1. 영상 기반 변화 감지
    • 전/후 페이지 이미지를 비교하여 적절한 변화량인지 확인
    • OCR 텍스트 길이 변화 감지
  2. 센서 기반 접촉 판단
    • 진공 센서로 종이 흡착 수 확인 (2장 이상인지)
    • 페이지가 붙어서 넘어간 경우 압력 차이로 탐지
  3. 페이지 번호 OCR
    • OCR로 페이지 번호 읽어서 이전 번호 +1인지 확인

🛠️ 기술 적용

  • Difference of Frame 방식 / Optical Flow
  • 간단한 텍스트 길이 threshold 분석
  • 압력 센서 또는 진공 압 검출

✅ 3. 오류 복구 알고리즘 (Backward Recovery Turning Algorithm)

📌 목적

2장 이상 넘겼거나 실패한 경우 되돌리기

🔄 방식

  • 역방향 페이지 넘김 모드 작동
  • 감지된 실패 페이지 수만큼 되돌리기
  • 실패 후 자동 재시도 루프 (n회까지)

🛠️ 구현 포인트

  • 이전 페이지의 접착력이 낮아야 함 (되돌리기 쉬워야 함)
  • 감지/판단 알고리즘과 연동되어야 함

✅ 4. OCR 및 텍스트 추출 알고리즘

📌 목적

넘긴 페이지를 실시간 디지털화

🔍 단계

  1. 이미지 왜곡 보정
    • 책 가운데 말림 보정 (curve fitting or mesh flattening)
    • 카메라 각도 보정 (Perspective Transform)
  2. OCR 수행
    • Tesseract, Google Vision API, 또는 커스텀 트레이닝 모델
    • 페이지 번호, 본문 텍스트, 수식 등 인식
  3. 텍스트 구조화 및 저장
    • 단락, 제목, 번호 등 구조 인식
    • PDF, TXT, JSON 형태로 저장

🛠️ 기술 적용

  • BookScannerNet (book flattening)
  • CRNN, TrOCR 등 최신 모델
  • 텍스트 후처리로 요약/구조화 가능 (optional GPT API 연동)

🎯 종합 시스템 흐름

[페이지 인식]
→ [흡착 및 넘김]
→ [한 장 판별]
   → (성공) → [OCR] → 저장
   → (실패) → [역방향 복구] → 재시도

✍️ 요약

알고리즘 주요 기술 문제 상황 대응
정방향 넘김 엣지 디텍션, 궤적 계획 한 장 넘기기
판별 이미지 diff, OCR 비교 다중 페이지 탐지
역방향 복구 페이지 수 추정 후 반대로 넘기기 실패 복구
OCR 왜곡 보정 + 문자 인식 디지털화, 저장

오늘은 여기까지!

내일모레 다시 돌아온다.

이 제품의 잠재 고객들을 찾아보고 웹을 돌아다니며 이 제품 가치를 더욱 명확히 검증해보자. 기술적으로 하드웨어는 어떤 식으로 만들어야 하는지, 미리 준비할 것이 있는지 조사해보기!