콘텐츠로 이동

discover 정량 렌즈 통합 — 전체 설계 그림 (S356)

PM 4대 부족점(매물구조·손익비·결합·레짐)을 메우는 4묶음을 현 discover 파이프라인에 통합하는 아키텍처. 출발점 문제: discover 2시간+ 단축 + 매물구조/손익비를 수학으로 + 분절(각 종합자 따로 verdict) 해소.


현재 구조 (S356 기준)

universe 200 (D20 거래대금 상위)
   │
   ▼ pre-gate (차트 복합강도 정량 컷)
30종목
   │
   ▼ 종목당 14 LLM 호출:
   │   D2 차트(관찰5+종합1=6) · D3/D4/D5 raw(LLM0) · D6 펀더(관찰4+종합1=5) · Dnews(관찰2+종합1=3)
   │   = 차트·펀더·재료 종합자가 각자 verdict
   ▼
D7 selector ← score_compose.compose_candidates (Borda 랭크 합성)
   │
   ▼
selected 1종 + runners_up

문제점 (PM이 짚은 것): - 매물구조: chart_indicators.compute_volume_profile = POC/overhang 스칼라 1개. 가격대별 두께 없음. - 손익비: trader/entry가 진입/손절/목표를 LLM 서술로 지어냄. 수학 근거 없음. - 분절: 차트·펀더·재료 종합자가 각자 LLM으로 verdict → D7에서야 합쳐짐. 매물 의미가 자금·재료와 결합 안 됨. - 레짐: 추세vs평균회귀 판별 없음 → 같은 매물벽을 국면 무관하게 해석. - 시간: 30종목 × 14 LLM = 420 호출 = 2시간+.


목표 구조 — 정량 렌즈 레이어 신설

핵심 원칙(PM): 코드(수학)가 할 수 있는 판정은 코드가. LLM은 수학이 못 하는 결합·맥락만. → 정량 렌즈가 강해지면 (a)pre-gate가 강력해져 LLM 대상↓ (b)LLM 관찰이 수학 산출을 재서술 안 함 → 호출↓.

universe 200
   │
   ▼ [신설] 정량 렌즈 엔진 (전 종목, 코드만, LLM 0) ──────────────┐
   │   ① 매물구조: VP 과학화(VAH/VAL/POC/HVN/LVN 가격대별 두께)      │
   │   ② 레짐: Hurst/VR/반감기/ER → 추세 vs 평균회귀 vs 압축          │ 일봉·30분봉·수급
   │   ③ 손익비 얼개: 매물대 기반 손절/목표/RR + σ√t 도달확률        │ 전부 우리 데이터
   │   ④ 추세·수급: EWMAC/ADX/체결강도z/수급z                        │ → 백테스트 가능
   │                                                                  │
   ▼ [강화] pre-gate ← 정량 렌즈로 컷 (손익비 나쁜·자리 나쁜 종목 정량 탈락)
30 → 12~15종목 (정량이 강하니 더 좁혀도 안전)
   │
   ▼ 종목당 LLM (정량이 끝낸 건 재서술 안 함 → 관찰 축소)
   │   차트 종합: 관찰을 "수학 산출 위에서 국면 해석"으로 (관찰5개 → 종합이 VP/레짐 수치 받아 판단)
   │   펀더·재료: 유지 (수학 렌즈 밖 영역)
   ▼
[신설] 결합 레이어 — 메타라벨링 + Carver FDM (코드)
   │   1차: 멀티팩터 점수(매물+레짐+수급+추세+재료) = 방향
   │   2차: 시장자금 국면·재료크기·가격반영도로 실행확률 P(win) 보정
   │   FDM: 신호 간 중복 상관 교정해 과대/과소 합산 방지
   ▼
D7 selector ← P(win)·기대R 순 (말이 아닌 확률·손익비로 선정)
   │
   ▼ selected: 진입가/손절가/목표가/RR/비중 = 정량 렌즈 산출 (Triple-Barrier 검증된 셋업)

4묶음의 위치와 역할

묶음 파이프라인 위치 산출 LLM?
① VP 과학화 정량 렌즈 엔진 (universe 전) VAH/VAL/POC/HVN/LVN, 위/아래 매물 두께·거리 코드
② 레짐 판별 정량 렌즈 엔진 trend/meanrev/compression + 신뢰도 코드
③ 손익비(Triple-Barrier+ATR) 렌즈 엔진 + D7 출력 진입/손절/목표/RR + 셋업 과거 승률·평균R 코드
④ 결합(메타라벨+FDM) D7 직전 결합 레이어 P(win) 보정확률 + 결합 점수 코드

검증(백테스트) 흐름: Triple-Barrier가 과거 universe 후보에 라벨(익절/손절/시간) → 각 정량 렌즈(VP·레짐·수급)의 라벨 예측력을 측정 → 예측력 있는 렌즈만 결합에 채택. "수학 렌즈가 실제로 맞았나"를 데이터로 검증 (PM이 원한 검증 가능성).


시간 단축 효과 (출발점 문제 해결)

구간 현재 목표 근거
pre-gate 후 종목수 30 12~15 정량 렌즈가 손익비·레짐으로 강하게 컷
종목당 LLM 14 ~8~10 차트 관찰이 수학 산출 재서술 안 함(VP/레짐은 코드)
Phase4 총 호출 420 ~120~150 15종 × 9
결합 D7 LLM 코드(메타라벨+FDM) 분절 해소 + LLM 1회 감소

2시간+ → 추정 40~60분 (호출 ~65% 감소). + 결과는 "검증된 수학 렌즈 + 확률·손익비 명시"로 질 상승.


미해결·결정 필요 (세부 설계 전)

  1. VP 빈 배분 방식: 30분봉 거래량을 가격빈에 어떻게(균등분배 vs 종가집중)? POC가 달라짐 → 방식 고정 필요.
  2. 레짐 룩백·임계: Hurst/VR의 종목별 룩백, ADX 25 같은 미국식 임계 → 한국 단기에 재캘리브레이션.
  3. 메타라벨 2차 모델: 룰 기반(가중합) vs ML(로지스틱/트리)? PM의 "코드 준비 데이터 + 고정 규칙" 원칙과 맞춤.
  4. 백테스트 기간·라벨 파라미터: Triple-Barrier pt/sl 배수, 수직장벽 N일(단기=며칠).
  5. pre-gate 컷 기준: 정량 렌즈 중 무엇으로 컷할지(손익비 RR 하한? 레짐 부적합 탈락?).