콘텐츠로 이동

LxS v2c 검증 — DSR + PBO + Purged CV + OOS Holdout

Date: 2026-05-24 (Sun) Topic: L Predecessor: 2026-05-24_S308_lxs_v2b_backtest.md

검증 4종 결과 종합

검증 결과 평가
DSR (64 hypothesis 보정) 0 cells significant @ 5% 개별 sharpe 우위 입증 못함
PBO (Combinatorial Symmetric CV) 0.0381 (3.81%) 매우 안전 (cell selection robust)
Purged CV (5-fold, 20d embargo) 극단 cell 100% sign consistency 부호 일관
OOS holdout (2025-10-01 cutoff) 80% sign match (8/10) + 극단 alpha 증폭 신호 견고

결론: DSR은 통과 못했지만 PBO + Purged + OOS는 강한 검증. DSR 실패는 개별 cell 단위 sharpe가 약해서 (alpha는 있지만 분산 큼) — sharpe 우위 입증은 X, mean alpha 자체는 OOS에서 더 강화.

상세 결과

1) DSR (Deflated Sharpe Ratio)

  • 16 cell × 4 Δ + 16 cell×Δ = 64 hypothesis
  • López de Prado·Bailey 2014 표준 적용 (Bonferroni-style E[max SR] 계산)
  • 5% 유의 cell = 0개 / 1% 유의 cell = 0개

해석: 다중검정 보정 후 어떤 cell도 sharpe 통계적 우위 미달성. cell selection 시 64 hypothesis 시험으로 우연 발견 가능성 배제 못함. sharpe 기반 운영 룰 보장은 X.

2) PBO (Probability of Backtest Overfitting)

  • Bailey·Borwein·LdP·Zhu 2014 CSCV
  • 12 strategies(cells) × 210 IS/OOS partition combinations
  • PBO = 0.0381 (3.81%) → "stable (low overfitting)"

해석: IS best cell이 OOS에서 median 아래로 떨어지는 비율 3.81%. cell selection 자체는 매우 안정 — 상위 cell이 우연으로 뽑힌 게 아님.

3) Combinatorial Purged CV (5-fold, 20d embargo)

Cell mean α OOS std α folds sign consistency
VERY_LOW/LOW -9.69pp 4.50 4 1.00
VERY_HIGH/VERY_HIGH +6.83pp 5.32 2 1.00
LOW/VERY_HIGH -2.93pp 2.81 5 0.80
LOW/LOW +1.17pp 1.25 5 0.80
HIGH/LOW +2.12pp 4.77 4 0.75
HIGH/VERY_HIGH -2.17pp 5.22 4 0.75
VERY_LOW/HIGH -1.19pp 1.96 3 0.67
VERY_LOW/VERY_HIGH -3.37pp 3.69 3 0.67
HIGH/HIGH +0.24pp 2.46 5 0.40
LOW/HIGH -1.20pp 4.03 5 0.40
  • 극단 cell 부호 일관성 100% — VERY_LOW/LOW(회피)와 VERY_HIGH/VERY_HIGH(매수) 신뢰 가능
  • VERY_HIGH/VERY_HIGH는 2 folds로만 검증 — 표본 부족 주의
  • 중간 cell sign consistency 40~80% — regime 신호 불안정

4) OOS Holdout (cutoff 2025-10-01)

  • IS n=24,180 baseline +3.16% | OOS n=6,266 baseline +10.57% (강세장)
Cell IS alpha OOS alpha sign match OOS n
VERY_HIGH/VERY_HIGH +0.67pp +12.25pp 976
VERY_LOW/LOW -8.20pp -16.24pp 245
HIGH/VERY_HIGH +0.37pp +4.80pp 240
HIGH/HIGH +0.25pp +4.76pp 730
LOW/VERY_HIGH -0.56pp -4.51pp 476
VERY_LOW/VERY_HIGH -2.42pp -7.89pp 451
VERY_LOW/HIGH -1.55pp -2.87pp 737
LOW/LOW +0.32pp +0.02pp 708
LOW/HIGH +0.59pp -8.22pp 1,006
HIGH/LOW -3.53pp +5.07pp 689

8/10 sign match = 80% ✅ (매핑표 §7 검증 기준 ≥70% 통과)

핵심: VERY_HIGH/VERY_HIGH (매수)와 VERY_LOW/LOW (회피) 두 극단 cell이 OOS에서 alpha 증폭 (12pp+ / -16pp). 운영 핵심 신호로 신뢰 가능.

Sign flip 2건: LOW/HIGH, HIGH/LOW — 모두 중간 영역, IS alpha 자체가 ±1pp 미만 약신호였음.

운영 룰 최종 (검증된 cell만)

Tier 1 ★ — 매수 강화 / 회피 (OOS alpha + Purged sign 1.0)

Cell 행동 OOS alpha
L:VERY_HIGH / S:VERY_HIGH pool ×2.0, momentum overweight +12.25pp
L:VERY_LOW / S:LOW pool ×0.2, 회피 + tail hedge ON -16.24pp

Tier 2 — 정상 운영 (OOS sign match)

Cell OOS alpha 행동
L:HIGH / S:VERY_HIGH +4.80pp pool ×1.2
L:HIGH / S:HIGH +4.76pp pool ×1.2
L:LOW / S:VERY_HIGH -4.51pp pool ×0.7
L:VERY_LOW / S:VERY_HIGH -7.89pp pool ×0.5
L:VERY_LOW / S:HIGH -2.87pp pool ×0.8
L:LOW / S:LOW +0.02pp pool ×1.0 (중립)

Tier 3 — 운영 보류 (sign flip)

  • L:LOW / S:HIGH — OOS sign flip, 운영 보류
  • L:HIGH / S:LOW — OOS sign flip, 운영 보류

Δ-Layer 활용 (v2b 산출, v2c 미검증)

PM 결정 사항: v2c에서 Δ-layer DSR/PBO 별도 미실행. 운영 시 보조 신호로만 사용: - Bear + L_IMPROVING_ONLY = 회복 진입 신호 (v2b alpha +3.84pp) - Bull + S_IMPROVING_ONLY = 꼭지권 함정 (-2.85pp) - → 운영 단계에서 LLM 입력으로 주입, 트레이드 자동 신호로는 사용 안 함

핵심 결론

  1. 신호 견고성 검증 — PBO 3.81%, OOS 80% sign match, 극단 cell 부호 100% 일관 (Purged CV)
  2. 단 sharpe 통계 우위는 입증 못함 (DSR) — 다중검정 보정 통과 X. 결과 alpha는 mean 기준만 신뢰.
  3. 극단 cell (VERY_HIGH/VERY_HIGH 매수 + VERY_LOW/LOW 회피) 운영 가능 — 이중 검증 + OOS 증폭
  4. 중간 cell은 alpha 자체가 작아 운영 효과 미미 — sign flip 가능
  5. v2b → v2c 검증 합격: 운영 룰 채택 가능 (단 sharpe 약속 X, mean alpha 기반만)

한계

  1. VKOSPI 미통합 — 후속 보강 (KRX MDCSTAT 백필)
  2. 종목 단위 미적용 — sample-pooled. stock-conditional alpha 미추정
  3. OOS 기간 6개월(2025-10~2026-04) — 강세장 편향 가능, bear regime OOS 필요
  4. Δ-layer는 DSR/PBO 미검증 — 보조 신호로만 사용
  5. DSR 실패 — 더 많은 sample 또는 더 narrow hypothesis로 재검증 필요

다음 (v3 또는 운영 진입)

(a) 운영 진입: 본 Tier 1/2 룰을 morning/signal-synthesizer에 LLM macro_context로 주입. 실시간 검증 시작.

(b) v2 추가 검증: VKOSPI 백필 + bear regime OOS 추가 + 종목 단위 alpha

(c) v3 확장: regime-conditioned base-rate matrix를 verdict × cell로 종목 진입에 직접 곱셈 — pool 크기뿐 아니라 종목별 우선순위에 적용

산출

  • scripts/backtest/lxs_v2c_validate.py (검증 4종)
  • data/backtest/lxs_v2c/validation_report.json
  • 본 문서