콘텐츠로 이동

v3 정량 렌즈 — 기법×적용 2층 정리 (중복 제거) (S356)

발산 6진입점 블라인드로 70개 중 30개 중복. 고유 기법 39개로 정리(원본 70개 = 39 기법 × 적용 인스턴스).

각 기법은 한 번만 정의, 적용 데이터가 다르면 인스턴스로 나열. ✅백테스트가능 🔸부분.

L1 레짐 (6개 기법)

마르코프 레짐스위칭 / HMM ✅ #1 (+#2,#12,#20,#44 병합)

  • 수학: 이산잠재상태+필터 | 단위: 일
  • 적용: 가격수익률(#1·12·20 동일) · 다변량[가격+거래량+체결강도] HMM(#2) · 체결강도 단독(#44)
  • 계산식: 관측밀도(가우시안): f(r_t|S_t=j)=(1/√(2πσ_j²))·exp(-(r_t-μ_j)²/(2σ_j²)). 전이행렬 P=[p_ij], p_ij=Pr(S_t=j|S_{t-1}=i), Σ_j p_ij=1. Hamilton 필터: (예측) ξ_{t|t-1}(j)=Σ_i p_ij·ξ_{t-1|t-1}(i). (갱신) ξ_{t|t}(j)= [f(r_t|S_t=j)·ξ_{t|t-1}(j)] / [Σ_k f(r_t|S_t=k)·ξ_{t|t-1}(k)]. 분모=로그우도 기여분, 이를 합산해 MLE로 μ
  • 목적: 내일 상단돌파 확률 = ξ_{t|t}(강세)·(강세장 상승조건부확률). 레짐확률이 손익비 가중에 직접 들어감(강세 레짐일수록 목표가를 멀리, 손절을 타이트하게). 전이행렬로 '오늘 약세인데 내일 강세로 바세 확률 p_{약→강}'을 손절 완충에 반영.

통계적 점프모델 ✅ #6

  • 수학: 점프페널티 강건레짐 | 단위: 일
  • 적용: 강건 강세/약세(레짐 오탐 방지)
  • 계산식: 목적함수 최소화: min_{Θ,S} Σ_t ||f_t - μ_{S_t}||² + λ·Σ_t 1{S_t ≠ S_{t-1}}. 앞항=각 시점 특징벡터 f_t를 배정상태 중심 μ에 맞추는 적합오차, 뒷항=상태가 바뀐 횟수×λ(점프 페널티). 동적계획으로 최적 상태경로 S 풀고 μ 갱신을 교대(coordinate descent). 특징 f_t=수익률·하방편차·EWMA변동성 등 return-only 측도.
  • 목적: 단기 진입에서 가장 큰 적은 레짐 오탐(거짓전환). 점프모델은 강건한 강세/약세 판정을 줘 '진짜 강세장에서만 공격적 진입'을 가능케 한다. 0/1 노출전략(강세=풀매수, 약세=현금)의 스위치로 직결—exposure 결정에 바로 매핑.

BOCPD 변화점탐지 🔸 #4 (+#13,#21,#43 병합)

  • 수학: run-length 사후확률 | 단위: 일
  • 적용: 수익률(#4·13·21 동일) · 공매도/대차(#43)
  • 계산식: run length r_t의 결합사후 재귀: 성장(변화없음) P(r_t=r_{t-1}+1, x_{1:t}) = P(r_{t-1}, x_{1:t-1})·π(x_t|x_{(r)})·(1-H(r_{t-1})); 변화점 P(r_t=0, x_{1:t}) = Σ_{r_{t-1}} P(r_{t-1}, x_{1:t-1})·π(x_t|x_{(r)})·H(r_{t-1}). 정규화: P(r_t|x_{1:t})=P(r_t,x_{1:t})/Σ_r P(r_t,x_{1:t}). 위험함수(상수) H(r)=1/λ. 예측사후 π
  • 목적: 레짐스위칭이 '어느 상태냐'를 준다면 BOCPD는 '언제 바뀌었냐/바뀌는 중이냐'를 준다. 돌파 직후 변화점확률 급등=추세 신뢰도↑(진입), 보유 중 변화점확률 급등=레짐붕괴 손절신호. 손절 트리거를 ATR 같은 임의배수가 아니라 통계적 구조변화 확률로 대체.

GARCH족(GJR/EGARCH) ✅ #5

  • 수학: 비대칭 조건부변동성 | 단위: 일
  • 적용: 내일 변동성 σ_{t+1} = 손절폭 분모
  • 계산식: GJR-GARCH(1,1): σ_t² = ω + α·ε_{t-1}² + γ·I_{t-1}·ε_{t-1}² + β·σ_{t-1}², I_{t-1}=1 if ε_{t-1}<0 else 0 (하락충격에 γ 추가가중). EGARCH(1,1): ln σ_t² = ω + β·ln σ_{t-1}² + α(|z_{t-1}|-E|z|) + θ·z_{t-1}, z_{t-1}=ε_{t-1}/σ_{t-1} (부호항 θ가 비대칭). 다단예측: E[σ_{t+h}²]은 위 식 반복대입.
  • 목적: 손절폭·목표폭·손익비를 수학으로 산정하는 핵심: 손절폭 = k·σ_{t+1|t}(예측변동성 기반, ATR보다 forward-looking). 포지션크기 ∝ 1/σ_{t+1}²(변동성 타게팅). 상단돌파 확률 = Φ((목표-현재)/σ_{t+1})—정규(또는 t)분포 가정 하 도달확률.

칼만필터 / 상태공간 ✅ #3 (+#19,#39 병합)

  • 수학: 가우시안 선형 상태추정 | 단위: 분+일
  • 적용: 시변추세·동적베타(#3) · 시변헤지비율(#19) · 수급 잠재매집강도(#39)
  • 계산식: 상태(국소선형추세): x_t=[level_t, slope_t]', 전이 x_t=F x_{t-1}+w_t, F=[[1,1],[0,1]], w_t~N(0,Q). 관측 y_t=H x_t+v_t, H=[1,0], v_t~N(0,R). 예측: x̂{t|t-1}=F x̂{t-1}, P_{t|t-1}=F P_{t-1} F'+Q. 갱신: 칼만이득 K_t=P_{t|t-1}H'(H P_{t|t-1}H'+R)^{-1}; x̂t=x̂{t|t-1}+K_t(y_t-H x̂_{t|t-1}); P_t=(I-K_t H)
  • 목적: 지지/저항을 잠재 level_t의 신뢰구간(±√P_t)으로 정의 가능—'추세선 ± 1σ'가 동적 지지저항대. 동적베타는 시장이 빠질 때 이 종목이 얼마나 따라빠질지(손절폭 산정)에 직결. slope_t 부호·크기가 단기 진입신호.

Hurst / DFA / ARFIMA ✅ #32 (+#31 병합)

  • 수학: 장기기억·프랙탈 | 단위: 일
  • 적용: 추세vs평균회귀 성격(#32 DFA) · 장기기억 RV(#31 ARFIMA)
  • 계산식: 누적합 Y(k)=Σ_{i=1}^k (r_i − r̄). 구간길이 l로 분할, 각 구간서 다항추세 제거 후 잔차. F(l)=sqrt( (1/N)Σ (Y(k)−추세)^2 ). F(l)∝l^α. α=log F vs log l 회귀기울기. α<0.5 반지속(평균회귀), α=0.5 랜덤워크, α>0.5 지속(추세). H≈α.
  • 목적: 전략선택: α>0.5 종목엔 추세추종(상단돌파 진입 유리), α<0.5엔 역추세(하단받침 매수). 진입논리를 종목 성격에 맞춤. PM이 이미 Hurst/Variance Ratio 검토했으나 DFA는 비정상에 강건한 별도 추정량(재수집 아님, 보완).

L2 도달확률 (4개 기법)

도달확률 first-passage ✅ #8 (+#9,#70 병합)

  • 수학: 확률과정 배리어 | 단위: 일
  • 적용: GBM 이중배리어(#8) · OU 반감기(#9) · 몬테카를로 경로(#70)
  • 계산식: 로그가격 X=ln(S). drift µ=(일평균로그수익 - 0.5σ²), 변동성 σ. 상단 b=ln(U/S0)>0, 하단 -a=ln(L/S0)<0. 무드리프트 근사 P(상단먼저)=a/(a+b). 드리프트 포함: λ=2µ/σ² 일 때 P(상단먼저)=(1-e^{λa})/(1-e^{-λb}) ... wait 정식: P(up first)=(e^{λa}-1)/(e^{λa}-e^{-λb}) where λ=-2µ/σ². 마틴게일 e^{λX}로 optional stopping 적용. 식 확인됨(columbia
  • 목적: 손익비와 도달확률을 한 식에서 동시 산출: 목표가/손절가를 넣으면 우선도달확률 p가 나오고, 기대값 = p이익 - (1-p)손실. p가 손익비의 역수보다 크면 진입. 단기 진입확률을 분포가 아닌 '레벨 도달 게임'으로 환산.

EVT POT-GPD ✅ #10 (+#22 병합)

  • 수학: 극단값 꼬리분포 | 단위: 일
  • 적용: 꼬리 손절폭(#10·22 동일)
  • 계산식: 임계 u 초과분 Y=X-u. P(X>x|X>u) ≈ (1+ξ(x-u)/β)^{-1/ξ} (GPD). VaR_p = u + (β/ξ)[((n/N_u)(1-p))^{-ξ} - 1]. ES(꼬리기대)=VaR/(1-ξ)+(β-ξu)/(1-ξ). ξ=꼬리지수, β=스케일. 식 확인됨(AnalystPrep FRM, ScienceDirect GPD).
  • 목적: 손절폭을 ATR(평균변동)이 아닌 꼬리분위수(예 1% VaR)로 설정 → 정상범위 노이즈엔 안 걸리고 진짜 붕괴만 손절. 손익비 계산의 분모(최대허용손실)를 꼬리분포로 정밀화. 갭하락 잦은 한국장에 적합.

코퓰러 의존성 ✅ #14 (+#41,#55 병합)

  • 수학: 결합분포·꼬리의존 | 단위: 일
  • 적용: 종목-지수 도달(#14) · 수급-수익 하방의존(#41) · 신호간 결합(#55)
  • 계산식: 주변분포 F_X,F_Y(경험분포). 결합 C(u,v) 적합. 조건부확률 P(X≤x|Y=y)=∂C(u,v)/∂v |{u=F_X(x),v=F_Y(y)}. 하단꼬리의존 λ_L=lim{q→0}C(q,q)/q (Clayton>0). 오미스프라이싱지수 MI=P(R_X<r_x|R_Y=r_y). 식 확인됨(Hudson&Thames copula, arbitragelab MI strategy).
  • 목적: 지수/대장주가 상단돌파할 때 후발종목이 따라줄 조건부확률 → 동조매수 진입 타이밍. MI<임계면 종목이 지수대비 저평가(받칠 자리). 매크로→종목 연결을 확률로. 하단꼬리의존 높으면 지수급락 시 동반붕괴 위험 → 손절 강화.

VECM 가격발견 ✅ #63

  • 수학: 공적분 영구-일시분해 | 단위: 일
  • 적용: 지수/섹터 대비 종목 일시눌림/과열
  • 계산식: ΔY_t = αβ'Y_{t-1} + Σ Γ_i ΔY_{t-i} + ε_t; Gonzalo-Granger 영구성분 f_t = γ'⊥ Y_t (γ⊥ ⊥ α), 일시성분 = Y_t - 공통추세 적재. 정보비중 = α_⊥ 성분의 기여비율. 종목의 일시성분(잔차) = 단기 평균회귀 신호.
  • 목적: 상하단 확률(목적1,2): 종목이 지수 대비 일시적으로 눌렸으면 하단 받침(반등) 확률↑, 과열이면 상단 저항. 매물구조를 '상대가치'로 보강.

L3 손익비 (3개 기법)

분위수회귀 / CAViaR ✅ #7 (+#11,#23,#46 병합)

  • 수학: 체크손실 분위수예측 | 단위: 분+일
  • 적용: 내일수익 5/50/95%(#7·11·23 동일) · 일중고저밴드(#46)
  • 계산식: 분위수 τ 추정: min_β Σ_t ρ_τ(r_t - x_t'β_τ), 체크손실 ρ_τ(u)=u·(τ - 1{u<0}) = max(τu, (τ-1)u). 즉 양의오차는 τ로, 음의오차는 (1-τ)로 비대칭 가중. 예측: Q_τ(r_{t+1}|x_t)=x_t'β̂_τ. 예측변수 x_t=과거수익률·체결강도·수급·변동성. VaR_τ = Q_τ.
  • 목적: 목적의 핵심 4요소를 한 모델로: (1)상단돌파확률≈1-τ where Q_{τ}=목표가, (2)하단받침=Q_{0.05}(확률적 지지선=손절 후보), (3)손익비=(Q_{0.95}-진입)/(진입-Q_{0.05}) 직접계산, (4)예측변수에 수급·체결강도·재료더미를 넣어 결합. ATR손

거래비용 추정(4종) ✅ #33 (+#35,#36,#37 병합)

  • 수학: 미시구조 일집계 | 단위: 일
  • 적용: Amihud(#33)·제곱근충격(#35)·Corwin-Schultz(#36)·Roll(#37) — 4개 독립
  • 계산식: ILLIQ_t = |r_t| / (거래대금_t) (일별). 기간평균 ILLIQ = (1/D)Σ |r_d|/Vol_d. 단위: 가격변화%/원. 클수록 비유동(소액에도 크게 움직임). 로그·윈저화로 분포보정.
  • 목적: 상단돌파 신뢰도: ILLIQ 낮은(유동) 종목의 돌파가 더 견고, 높은 종목은 얇은 호가로 가짜돌파·되돌림 위험. 진입 슬리피지 사전추정(손익비 비용항). 비유동 프리미엄으로 며칠보유 수익기대 보정.

컨포멀 예측구간 ✅ #67

  • 수학: 분포무관 보장커버리지 | 단위: 일
  • 적용: 내일 종가 90% 구간 → 손절/목표
  • 계산식: 비적합도점수 s_i = |y_i - ŷ_i| (또는 정규화). 분할컨포멀: 보정집합 점수의 (1-α)(1+1/n) 분위수 q̂ → 구간 [ŷ ± q̂]. 시계열판 SPCI: 조건부 분위수 Q_{1-α}(s) 를 점수의 자기상관으로 적응 재추정 → 비교환성 보정.
  • 목적: 손익비·상하단(목적1,2,3): 내일 종가의 90% 예측구간 하단=손절 후보, 상단=목표 후보를 보장커버리지로 산출. 어떤 점예측(ML·회귀) 위에도 래핑 가능.

L4 수급·점과정 (7개 기법)

Kyle's λ / OFI 가격충격 ✅ #34 (+#16 병합)

  • 수학: 부호화수급 선형회귀 | 단위: 일
  • 적용: Kyle λ(#34) · OFI 일별회귀(#16)
  • 계산식: Δp_t = λ · SignedVol_t + ε. 일별판(Hasbrouck): r_t = λ · sign(r_t)·sqrt(거래대금_t) + ε, λ=회귀기울기. 부호화 거래량은 우리 수급데이터(투자자별 순매수=기관/외인 방향)로 직접 구성 가능. λ 클수록 충격 큼(비유동·정보거래 우세).
  • 목적: 자금/세력 진입 판별: 우리 투자자수급(기관·외인 순매수)을 부호로 써서 '기관 순매수가 가격을 실제로 미는 강도(λ)' 측정 -> 수급이 가격에 먹히는지 확인. λ 높은 날 돌파는 정보성. 진입 시 내 주문 충격 예측.

전이엔트로피 ✅ #25 (+#40 병합)

  • 수학: 정보흐름 비선형인과 | 단위: 일
  • 적용: 투자자유형 선행(#25·40 동일)
  • 계산식: TE_{X->Y} = sum p(y_{t+1}, y_t, x_t) log [ p(y_{t+1}|y_t,x_t) / p(y_{t+1}|y_t) ]. X의 과거가 Y미래에 주는 '추가 정보'(비트). 이산화(분위수 binning) 후 추정, 부트스트랩으로 유의성. 비대칭: TE_{X->Y} != TE_{Y->X}로 선도/추종 판별. 신호: TE_{외국인순매수->수익률}>0 & 유의 -> 외국인이 선행.
  • 목적: 자금/수급결합(목적4): 어느 주체가 가격선행인지 확인 후 그 주체 순매수를 진입신호로 우선 가중. 상단돌파(목적1): 선행주체의 매수전이가 강해지면 돌파확률 상승. 결합: TE로 '신호 소스의 신뢰도 가중치'를 데이터로 산정.

VPIN 일별판 ✅ #45

  • 수학: BVC 주문독성 | 단위: 분+일
  • 적용: 정보비대칭(매수매도 미구분 처리)
  • 계산식: 각 30분봉 buckets에서 매수량 V_b^B = V_b·Φ( ΔP_b / σ_ΔP ), 매도량 V_b^S=V_b−V_b^B. Φ=표준정규CDF, ΔP=봉 종가변화, σ_ΔP=ΔP 표준편차. VPIN = Σ|V_b^B−V_b^S| / Σ V_b (롤링 n버킷, 보통 50). 일단위 집계는 당일 30분봉들로 한 버킷셋 구성 또는 등량버킷 재샘플.
  • 목적: 단기 진입/매물구조 축: VPIN 급등은 정보비대칭 상승(누군가 알고 있음) → 큰 움직임 임박 신호. 방향은 BVC 순불균형 부호로 보강. 칼만 매집강도와 교차확인.

Hawkes 자기여기 🔸 #15 (+#24,#30,#47 병합)

  • 수학: 점과정 분기율 | 단위: 분+일
  • 적용: 점프클러스터 돌파지속(#15·24·30) · 공매도/체결 투매군집(#47)
  • 계산식: 강도 λ(t)=μ + Σ_{t_i<t} α·e^{-β(t-t_i)}. 분기율 n=α/β (점프1개가 낳는 평균후속점프, n<1 안정). 점프 후 강도점프 +α, β로 감쇠. 군집지속시간 ~1/β. 식 확인됨(arxiv Hawkes calibration, marked Hawkes JFEC).
  • 목적: 상단돌파(큰 양봉) 직후 분기율 높으면 추세지속 확률↑ → 돌파매수 유지. 분기율 낮으면 1회성 → 되돌림 대비. 일내 점프강도를 30분봉 큰변동 카운트로 집계해 '오늘 돌파가 며칠 갈지' 추정. 군집지속 1/β로 보유기간 가늠.

BNS 점프검정 ✅ #28

  • 수학: bipower 점프분리 | 단위: 분+일
  • 적용: 재료성 점프 vs 노이즈
  • 계산식: RV_t=Σ r_i^2 (30분봉 일중수익률 제곱합). BV_t=(π/2)·Σ|r_i||r_{i-1}| (인접 절대수익률 곱의 합, π/2≈1.5708 보정). 점프성분 J_t=max(RV_t−BV_t, 0). 점프비율 RJ_t=(RV_t−BV_t)/RV_t. 검정통계량 z=(RV_t−BV_t)/sqrt((θ·TQ_t)/n), θ≈0.6090, TQ는 tripower quarticity. z가 임계치(예 1.96~3) 초과면 그날 점프 유의.
  • 목적: 레짐/재료 판별: 어제 상승이 점프(재료성 갭·세력 진입=추세 지속 가능성)인지 연속변동(노이즈)인지 구분. 점프 유의일 다음날 추세지속/되돌림 통계를 백테스트해 진입확률에 결합. 상단돌파 신뢰도 필터.

실현 반변동성/왜도 ✅ #29 (+#38 병합)

  • 수학: 고차모멘트 부호분해 | 단위: 분+일
  • 적용: 상방/하방 분해(#29) · 실현왜도(#38)
  • 계산식: RS-_t = Σ r_i^2 · 1{r_i<0} (음수봉 수익률 제곱합). RS+_t = Σ r_i^2 · 1{r_i>0}. 항등식 RV=RS+ + RS-. 비대칭지표 SK_t=(RS+ − RS-)/RV (-1~+1). 부호점프변동 도 BNS 점프를 부호별로 분해 가능.
  • 목적: 하단받침 판단: RS-가 급증한 종목은 하방위험 큼(지지 약함). RS+ 우세는 매수압력 우위(상단돌파 후보). 손익비 설계 시 하방분산만 따로 써서 손절폭 산정. 학술적으로 RS-가 다음주 수익률과 유의관계(하방쏠림->되돌림 프리미엄).

베이시스 OU 트리거 ✅ #42

  • 수학: 평균회귀 최적정지 | 단위: 일
  • 적용: 선현 괴리 극단 → 회귀 일수
  • 계산식: OU: dX_t=κ(θ−X_t)dt+σdW_t. 이산 AR(1) 회귀 X_t=a+bX_{t-1}+e_t로 적합 → κ=−ln(b)/Δt, θ=a/(1−b), 반감기 H=ln2/κ. 정규화 z=(X−θ)/σ_eq, σ_eq=σ/√(2κ). 진입은 단순 z<−1이 아니라 Leung-Li 최적정지: 가치함수 V가 손절L 위 유계구간 [b, d]에서 진입영역. 빠른회귀(κ↑)→매수·매도레벨 근접, 변동성↑→레벨 이격(더 넓은 스프레드 대기).
  • 목적: 진입·손절·목표 축 + 레짐: 베이시스 극단(백워데이션 등)은 단기 수급 왜곡 신호. OU z-점수와 반감기로 '회귀까지 며칠' 추정 → 보유기간 적합성 게이트. 종목보다 시장 전체 수급긴장(프로그램 차익) 레짐 입력으로 활용.

L5 결합 (7개 기법)

직교화 ✅ #26

  • 수학: Gram-Schmidt/Lowdin | 단위: 일
  • 적용: 신호 중복 제거
  • 계산식: 신호행렬 X(열=각 알파). Gram-Schmidt: u_1=x_1, u_k=x_k - sum_{j 동일가중 합성.
  • 목적: 결합(목적4)의 수학적 기반: 매물(s-score)·수급(TE가중)·레짐(HMM)·점프(Hawkes) 신호가 서로 겹치면 합산이 과신을 부름 -> 직교화로 중복 제거 후 결합해야 확률이 정직. Grinold 법칙과 직결: 독립신호 N개면 IR이 sqrt(N) 개선.

베이지안 결합 ✅ #49 (+#50,#69 병합)

  • 수학: 로그오즈/순차/수축 | 단위: 일
  • 적용: WOE(#49)·순차체이닝(#50)·계층수축(#69)
  • 계산식: WOE_i(bin) = ln( P(x_i=bin | 상승) / P(x_i=bin | 하락) ). 사후 로그오즈 = ln(prior_up/prior_down) + Σ_i WOE_i. P(상승) = 1/(1+exp(-사후로그오즈)). IV_i = Σ_bin (P(bin|상승)-P(bin|하락))·WOE_i (신호별 정보가치).
  • 목적: 매물구조(30분봉 가격대별 체결), 수급(투자자별 순매수), 재료(공시/뉴스 더미), 레짐(변동성국면)을 각각 bin화→WOE→합산. 단기 진입확률을 하나의 보정 전 점수로 통합. 손익비는 P(상승)을 켈리/기대값 식에 투입.

확률 캘리브레이션 ✅ #51 (+#52 병합)

  • 수학: Platt/Isotonic | 단위: 일
  • 적용: 시그모이드(#51)·단조회귀(#52)→진짜 확률
  • 계산식: P(상승|s) = 1 / (1 + exp(A·s + B)). A,B는 별도 캘리브레이션셋에서 음의 로그우도 최소화로 적합. 타깃 라벨 평활화(t+=(N++1)/(N++2), t-=1/(N-+2))로 과적합 방지.
  • 목적: 어떤 결합신호든 출력을 베팅사이즈로 쓰려면 calibrated P가 필요. P(상승)=0.62를 신뢰하고 켈리분율·기대손익비에 투입.

로지스틱 스태킹 ✅ #53

  • 수학: 2단계 메타러너 | 단위: 일
  • 적용: 약신호 최적가중
  • 계산식: 1단계: 각 신호 모델 m_k가 oof 확률 p_k 산출. 2단계: logit(P) = β0 + Σ_k β_k·p_k. β는 최대우도로 추정, β_k≥0 비음 제약 가능. 점수=Σβ_k·p_k.
  • 목적: 매물·수급·재료·레짐 각각의 약신호를 최적가중 결합. PM의 'Markowitz 신호버전'을 분류문제로 구현(비음·합제약 가능).

최대엔트로피 결합 🔸 #54

  • 수학: KL 최소화 | 단위: 일
  • 적용: 중복정보 차단 합성
  • 계산식: min_q KL(q || prior) = Σ q ln(q/prior) s.t. E_q[g_i]=관측모멘트_i. 해: q*(x) ∝ prior(x)·exp(Σ_i λ_i g_i(x)). λ_i는 제약 충족하도록 풂(지수족). 신호=제약 g_i, prior=사전믿음.
  • 목적: 매물·수급·재료가 부분 중복일 때(예: 프로그램매매와 외국인수급) 정보 이중계상 방지. PM의 '중복정보 제거하며 합성' 요구의 직접 수학.

DML 인과분리 🔸 #56

  • 수학: 이중강건 처리효과 | 단위: 일
  • 적용: 재료의 순수 인과효과
  • 계산식: Y=θ·D + g(X)+ε, D=m(X)+ν. 잔차화: Ỹ=Y-ĝ(X), D̃=D-m̂(X). θ̂ = (Σ D̃·Ỹ)/(Σ D̃^2). g,m은 ML로 추정, cross-fitting으로 정규화편향 제거. CATE: θ(X)=재료효과의 종목/레짐별 이질성.
  • 목적: 재료신호가 진짜 알파인지 교란인지 판별. CATE로 '어떤 레짐·어떤 종목군에서 재료효과가 큰가'를 추정해 조건부 가중. PM의 '교란 통제 후 재료효과 추정' 직접 구현.

Grinold IC·breadth ✅ #27

  • 수학: 능동운용 정보비율 | 단위: 일
  • 적용: 신호 IC 채점·최종 랭킹
  • 계산식: 각 신호 i의 IC_i=corr(signal_i,t, return_{t+1}) (rank IC). 결합신호 가중 w_i ~ IC_i / sigma_i (또는 IC가중). IR = IC_combined * sqrt(BR), BR=독립신호수*거래빈도. 기대알파 = IC * sigma_return * z_score(표준화신호). 최적조합: 신호공분산 Omega로 w = Omega^(-1) * IC벡터(다신호 일반화).
  • 목적: 최종 결합(목적4)의 의사결정층: 앞 10개 기법의 신호를 IC로 채점하고 sqrt(breadth)로 '결합 후 기대 적중'을 산출 -> 단일 확률스코어로 종목 랭킹. 단기진입확률(목적3): 결합신호 z를 표준정규로 P(상승) 매핑.

L6 통계차익·분해 (6개 기법)

통계차익 s-score ✅ #17

  • 수학: PCA 잔차 OU | 단위: 일
  • 적용: 섹터 고유포트폴리오 잔차회귀
  • 계산식: 1) 252일 수익률행렬에서 상관행렬 PCA -> 상위 k개 고유벡터로 고유포트폴리오 팩터 F_j 구성. 2) 60일 윈도우로 r_i = beta_i0 + sum_j beta_ij F_j + e_i 회귀, 잔차 누적 X_i(t)=sum e_i. 3) X_i를 OU 추정: X(t+1)=a+bX(t)+zeta -> kappa=-ln(b)252(평균회귀속도), m=a/(1-b)(평형), sigma_eq=sqrt(var(zeta)/(1-b^2)). 4) s_i=(X_i - m_i)/sigma_eq_i
  • 목적: 단기진입 확률(목적3): s-score가 정규근사이므로 P(되돌림)=Phi(-s) 형태로 '하단받침/상단돌파 확률'을 직접 수치화. 매물구조(목적): 잔차 X는 시장과 무관한 종목 고유 매집/투매 누적의 프록시. 결합(목적): s-score는 -3~+3 표준화 스칼라라 다른 신호와 가중

공적분 바스켓 ✅ #18

  • 수학: Johansen+OU | 단위: 일
  • 적용: 테마/지주 페어 균형이탈
  • 계산식: 1) 로그가격 벡터 P_t에 Johansen trace test -> 공적분 벡터 w(고유벡터). 스프레드 S_t = w' * log(P_t). 2) S_t에 OU 회귀 dS=kappa(theta-S)dt+sigma dW -> 반감기 h=ln2/kappa. 3) z_t=(S_t - mean_h)/std_h (mean/std는 반감기 비례 윈도우). 진입 |z|>2, 청산 z->0, 손절 |z|>3. 포지션 크기 ~ -z (z에 비례 역방향).
  • 목적: 손익비(목적3): theta가 수학적 목표가, sigma/sqrt(2kappa)가 정지폭 -> 진입 z에서 (목표까지 거리)/(손절까지 거리)로 RR을 식으로 산출. 하단받침(목적): 페어가 음의 이탈일 때 통계적으로 '받칠 확률' = z의 정규꼬리. 단기진입: 반감기가 곧 예상 보유기

L1 추세필터 ✅ #59

  • 수학: 볼록최적화 구간선형 | 단위: 일
  • 적용: 추세 전환점
  • 계산식: min_x (1/2)·Σ(y_t - x_t)^2 + λ·Σ|x_{t-1} - 2·x_t + x_{t+1}| (D는 2차차분 행렬). HP필터는 같은 식에서 L1 대신 L2(제곱). 해 x는 구간선형, 기울기 변화(knot) 개수는 λ가 통제.
  • 목적: 상단돌파/하단지지(목적1,2): knot이 추세 가속/둔화 전환점이라 최근 knot 이후 기울기 부호·크기로 '내일 방향' 판단. 추세선을 눈대중이 아닌 최적화로 객관화.

MODWT 웨이블릿 ✅ #65

  • 수학: 다중스케일 분해 | 단위: 분+일
  • 적용: 노이즈제거 추세선
  • 계산식: X = Σ_{j=1}^J D_j + S_J (D_j=레벨 j 세부, S_J=평활). MODWT 계수 W̃{j,t} = Σ_l h̃{j,l} X_{t-l mod N} (다운샘플 없음, shift-invariant). 스케일별 분산 ν_X^2(τ_j) = (1/N)Σ W̃_{j,t}^2. 신호 = 노이즈스케일(D1~D2) 제거 후 추세스케일 재구성.
  • 목적: 상하단(목적1,2): 단기노이즈 D1~D2를 제거한 평활 S_J로 '진짜 추세선'을 그어 지지·저항 판정. 스케일별 변동성으로 돌파 임박 여부.

SSA ✅ #66

  • 수학: 궤적행렬 SVD | 단위: 일
  • 적용: 추세·주기 분해
  • 계산식: 임베딩: 길이 L 윈도로 궤적행렬 X (Hankel); SVD: X = Σ sqrt(λ_i) U_i V_i'; 그룹핑: 고유삼중항을 추세/주기/노이즈로 분류; 대각평균(Hankelization)으로 성분 시계열 복원. 예측: 선형순환식 R-forecast로 추세·주기 외삽.
  • 목적: 상하단·타이밍(목적1,2,3): 추세성분 외삽으로 내일 방향, 주기성분으로 단기 변곡 타이밍. 노이즈 제거 후 깨끗한 지지·저항.

오버나잇/인트라데이 분해 ✅ #64

  • 수학: Tug-of-War | 단위: 분+일
  • 적용: 갭 vs 일중 수익분해
  • 계산식: r_overnight,t = ln(Open_t / Close_{t-1}), r_intraday,t = ln(Close_t / Open_t), r_cc = r_on + r_id. 신호: 평활화한 (r_on - r_id) 스프레드가 차기 종가-종가 성과 시변예측. 종목별 과거 r_on/r_id 평균·자기상관이 차기 성분 예측.
  • 목적: 단기진입 타이밍(목적3): 갭(오버나잇) 강한 종목은 시가 매수 후 인트라데이 약세 주의, 또는 반대. 내일 '시가에 사서 종가에 팔까/홀딩할까'를 성분예측으로.

L7 검증·실행 (6개 기법)

Triple-Barrier/Trend-Scanning ✅ #58

  • 수학: 결과 라벨링 | 단위: 일
  • 적용: 과거 후보 익절/손절/추세 라벨
  • 계산식: 각 시점 t에서 L=L_min..L_max에 대해 y_{t..t+L} = a + b·(0..L) + e 적합 → t_b(L)=b_hat/SE(b_hat) 계산 → L = argmax_L |t_b(L)| → label = sign(b_hat(L)) if |t_b|>임계, else 0; 추세강도 = t_b(L*) 값 자체. SE(b)=sqrt(sigma_e^2 / Σ(x_i-x̄)^2)
  • 목적: 단기진입 확률(목적3): '내일 사면 추세가 며칠 이어질 t값이 충분한가'를 라벨로 직접 산출. 0 라벨은 진입 회피(횡보) 필터. 손익비 설정 없이 추세존속 기반 청산.

Cox 생존분석 ✅ #48

  • 수학: 비례위험 | 단위: 일
  • 적용: 돌파까지 일수 분포
  • 계산식: 위험률 h(t|x)=h_0(t)·exp(x'β). x=칼만 매집강도, VPIN, 체결강도레짐확률, λ_U, OU z. β는 부분우도 L(β)=Π_i [exp(x_i'β)/Σ_{j∈R(t_i)} exp(x_j'β)] 최대화. 사건='저항선(또는 +X%) 돌파'. 검열=관측종료까지 미돌파. P(돌파 ≤ d일 | x)=1−S(d|x), S=exp(−∫h).
  • 목적: 단기 진입확률+보유기간 축: 'D+1~D+5 내 돌파확률'을 공변량별로 산출 → 보유지평 매칭. 손익비의 '시간차원'(목표 도달 속도)을 제공 — 분위수회귀(가격분포)와 상보적(시간분포).

Deflated Sharpe+과적합 ✅ #60

  • 수학: 다중검정 보정 | 단위: 일
  • 적용: 가짜엣지 할인
  • 계산식: PSR(SR) = Φ[ (SR_hat - SR)·sqrt(T-1) / sqrt(1 - γ3·SR_hat + (γ4-1)/4·SR_hat^2) ]; DSR은 SR 자리에 다중검정 기대최대값 SR_0 = sqrt(V[SR])·((1-e)·Z^{-1}[1-1/N] + e·Z^{-1}[1-1/(N·e)]) 대입 (N=시험횟수, γ3/γ4=왜도/첨도, e=오일러상수).
  • 목적: 결합(목적4)의 메타검증: 우리가 수집한 수십 기법 중 어느 것이 다중검정 후에도 살아남는지를 확률로 판정. 가짜 엣지 채택 방지 — 전체 파이프라인 신뢰도 게이트.

블록부트스트랩 SPA ✅ #61

  • 수학: 리샘플 유의성 | 단위: 일
  • 적용: naive 대비 우월 p값
  • 계산식: 정상부트스트랩: 블록길이 ~ Geometric(p), 평균길이 1/p; 블록을 이어붙여 의사시계열 생성·재추출. White Reality Check 통계: V = max_k sqrt(T)·f̄_k (f_k=벤치마크 대비 초과성과); Hansen SPA: t_k^SPA = sqrt(T)·f̄_k / ω̂_k 의 최대값, 귀무분포는 부트스트랩으로.
  • 목적: 결합(목적4) 검증: 우리 신호가 매수후보 무작위 대비 통계적으로 우월한가를 p값으로. DSR과 상보 — DSR은 모수적, SPA는 비모수 부트스트랩.

부호제약 순차CV ✅ #57

  • 수학: Macrosynergy | 단위: 일
  • 적용: 미래누설 차단 가중
  • 계산식: signal_t = Σ_k w_k·z_k,t, w_k≥0(사전부호 강제). 가중은 확장윈도우 [1..t]서 학습→t+1 예측만 사용(panel time-series split). 평가: OOS Sharpe / 누적 PnL vs naive(동일가중 z_k). z_k=섹션별 표준화 신호.
  • 목적: 매물·수급·재료·레짐 신호의 결합가중을 실거래 가능한 방식으로 산출·검증. PM의 '프랩 실제 방법론' 요구에 직결(공개 퀀트샵 절차).

Almgren-Chriss 실행 🔸 #62 (+#68 병합)

  • 수학: 최적실행 궤적 | 단위: 분+일
  • 적용: 분할진입 충격최소(#62)·Q러닝(#68)
  • 계산식: min E[비용] + λ·Var[비용]; E = Σ permanent·(매매량) + Σ temporary·(매매속도)^2, Var = σ^2·Σ x_t^2 (잔여보유). 선형충격 가정시 최적 잔여보유 x_t = X·sinh(κ(T-t))/sinh(κT), κ = sqrt(λσ^2/η) (η=일시충격계수).
  • 목적: 진입·실행(목적3): 후보종목을 내일~며칠 매집할 때 일별 분할량·예상 충격비용을 수학으로. 손익비 계산에 실행비용을 포함시켜 현실적 목표가 보정.