discover 정량 렌즈 통합 — 전체 설계 그림 (S356)¶
PM 4대 부족점(매물구조·손익비·결합·레짐)을 메우는 4묶음을 현 discover 파이프라인에 통합하는 아키텍처. 출발점 문제: discover 2시간+ 단축 + 매물구조/손익비를 수학으로 + 분절(각 종합자 따로 verdict) 해소.
현재 구조 (S356 기준)¶
universe 200 (D20 거래대금 상위)
│
▼ pre-gate (차트 복합강도 정량 컷)
30종목
│
▼ 종목당 14 LLM 호출:
│ D2 차트(관찰5+종합1=6) · D3/D4/D5 raw(LLM0) · D6 펀더(관찰4+종합1=5) · Dnews(관찰2+종합1=3)
│ = 차트·펀더·재료 종합자가 각자 verdict
▼
D7 selector ← score_compose.compose_candidates (Borda 랭크 합성)
│
▼
selected 1종 + runners_up
문제점 (PM이 짚은 것): - 매물구조: chart_indicators.compute_volume_profile = POC/overhang 스칼라 1개. 가격대별 두께 없음. - 손익비: trader/entry가 진입/손절/목표를 LLM 서술로 지어냄. 수학 근거 없음. - 분절: 차트·펀더·재료 종합자가 각자 LLM으로 verdict → D7에서야 합쳐짐. 매물 의미가 자금·재료와 결합 안 됨. - 레짐: 추세vs평균회귀 판별 없음 → 같은 매물벽을 국면 무관하게 해석. - 시간: 30종목 × 14 LLM = 420 호출 = 2시간+.
목표 구조 — 정량 렌즈 레이어 신설¶
핵심 원칙(PM): 코드(수학)가 할 수 있는 판정은 코드가. LLM은 수학이 못 하는 결합·맥락만. → 정량 렌즈가 강해지면 (a)pre-gate가 강력해져 LLM 대상↓ (b)LLM 관찰이 수학 산출을 재서술 안 함 → 호출↓.
universe 200
│
▼ [신설] 정량 렌즈 엔진 (전 종목, 코드만, LLM 0) ──────────────┐
│ ① 매물구조: VP 과학화(VAH/VAL/POC/HVN/LVN 가격대별 두께) │
│ ② 레짐: Hurst/VR/반감기/ER → 추세 vs 평균회귀 vs 압축 │ 일봉·30분봉·수급
│ ③ 손익비 얼개: 매물대 기반 손절/목표/RR + σ√t 도달확률 │ 전부 우리 데이터
│ ④ 추세·수급: EWMAC/ADX/체결강도z/수급z │ → 백테스트 가능
│ │
▼ [강화] pre-gate ← 정량 렌즈로 컷 (손익비 나쁜·자리 나쁜 종목 정량 탈락)
30 → 12~15종목 (정량이 강하니 더 좁혀도 안전)
│
▼ 종목당 LLM (정량이 끝낸 건 재서술 안 함 → 관찰 축소)
│ 차트 종합: 관찰을 "수학 산출 위에서 국면 해석"으로 (관찰5개 → 종합이 VP/레짐 수치 받아 판단)
│ 펀더·재료: 유지 (수학 렌즈 밖 영역)
▼
[신설] 결합 레이어 — 메타라벨링 + Carver FDM (코드)
│ 1차: 멀티팩터 점수(매물+레짐+수급+추세+재료) = 방향
│ 2차: 시장자금 국면·재료크기·가격반영도로 실행확률 P(win) 보정
│ FDM: 신호 간 중복 상관 교정해 과대/과소 합산 방지
▼
D7 selector ← P(win)·기대R 순 (말이 아닌 확률·손익비로 선정)
│
▼ selected: 진입가/손절가/목표가/RR/비중 = 정량 렌즈 산출 (Triple-Barrier 검증된 셋업)
4묶음의 위치와 역할¶
| 묶음 | 파이프라인 위치 | 산출 | LLM? |
|---|---|---|---|
| ① VP 과학화 | 정량 렌즈 엔진 (universe 전) | VAH/VAL/POC/HVN/LVN, 위/아래 매물 두께·거리 | 코드 |
| ② 레짐 판별 | 정량 렌즈 엔진 | trend/meanrev/compression + 신뢰도 | 코드 |
| ③ 손익비(Triple-Barrier+ATR) | 렌즈 엔진 + D7 출력 | 진입/손절/목표/RR + 셋업 과거 승률·평균R | 코드 |
| ④ 결합(메타라벨+FDM) | D7 직전 결합 레이어 | P(win) 보정확률 + 결합 점수 | 코드 |
검증(백테스트) 흐름: Triple-Barrier가 과거 universe 후보에 라벨(익절/손절/시간) → 각 정량 렌즈(VP·레짐·수급)의 라벨 예측력을 측정 → 예측력 있는 렌즈만 결합에 채택. "수학 렌즈가 실제로 맞았나"를 데이터로 검증 (PM이 원한 검증 가능성).
시간 단축 효과 (출발점 문제 해결)¶
| 구간 | 현재 | 목표 | 근거 |
|---|---|---|---|
| pre-gate 후 종목수 | 30 | 12~15 | 정량 렌즈가 손익비·레짐으로 강하게 컷 |
| 종목당 LLM | 14 | ~8~10 | 차트 관찰이 수학 산출 재서술 안 함(VP/레짐은 코드) |
| Phase4 총 호출 | 420 | ~120~150 | 15종 × 9 |
| 결합 | D7 LLM | 코드(메타라벨+FDM) | 분절 해소 + LLM 1회 감소 |
→ 2시간+ → 추정 40~60분 (호출 ~65% 감소). + 결과는 "검증된 수학 렌즈 + 확률·손익비 명시"로 질 상승.
미해결·결정 필요 (세부 설계 전)¶
- VP 빈 배분 방식: 30분봉 거래량을 가격빈에 어떻게(균등분배 vs 종가집중)? POC가 달라짐 → 방식 고정 필요.
- 레짐 룩백·임계: Hurst/VR의 종목별 룩백, ADX 25 같은 미국식 임계 → 한국 단기에 재캘리브레이션.
- 메타라벨 2차 모델: 룰 기반(가중합) vs ML(로지스틱/트리)? PM의 "코드 준비 데이터 + 고정 규칙" 원칙과 맞춤.
- 백테스트 기간·라벨 파라미터: Triple-Barrier pt/sl 배수, 수직장벽 N일(단기=며칠).
- pre-gate 컷 기준: 정량 렌즈 중 무엇으로 컷할지(손익비 RR 하한? 레짐 부적합 탈락?).