매출·전망·이벤트·대체데이터 신호 수치화 리서치 (Round 5)¶
작성: 2026-05-22 | 선행: Round 1~4 주제: 펀더멘털(매출·전망)·기업이벤트·대체데이터를 어떻게 수치화·구조화하는가 배경: Round 4 퀀트 funnel이 가격 신호에 편향됨(5영역 중 3이 가격 파생). 본 라운드가 그 갭 — 매출·전망·이벤트·대체데이터 — 을 보강. 프레임 (PM): 퀀트의 핵심 = 수집 가능한 재료를 수치화해 체계화. 매출에서 알고 싶은 것 = ① 점점 좋아질 것인가(궤적) ② 이익이 목전인가(임박도).
0. 한 줄 결론¶
매출·전망 신호는 PM의 두 질문으로 정확히 갈린다 — 궤적(좋아지는가) 과 임박도(목전인가). 그리고 발견 신호(발표 4~8주 전 움직이는 선행 — 추정치 리비전·수주잔고·적자축소·nowcast)와 확인 신호(발표 시점 — SUE·가이던스·서프라이즈)를 분리해야 한다. 가장 차별적인 단일 신호는 이익 가속(레벨이 아니라 성장률의 2차 미분). 한국 현실: 컨센서스는 대형주 편중, 대체데이터 벤더 생태계 얕음 → DART 정형 공시(이벤트 드리븐)가 한국에서 가장 안정적인 원천.
1. 핵심 발견 (영역 횡단)¶
CF1. 매출·전망 신호 = 궤적 축 + 임박도 축¶
- 궤적("점점 좋아질 것인가"): 이익 성장률 시계열, 이익 가속, SUE 추세, 리비전 모멘텀, beat streak.
- 임박도("이익이 목전인가"): 흑자전환 근접도, quarters_to_breakeven, book-to-bill 1.0 돌파, nowcast gap, FQ1(당분기) 추정치 리비전, 가이던스 변화.
- 두 축은 다른 필드로 분리 보관. FQ1 리비전 = 임박도, FY2 리비전 = 궤적.
CF2. 가장 차별적 신호 = 이익 가속 (2차 미분)¶
He & Narayanamoorthy(JAE 2020): EarnAccel_t = EarnGrowth_t − EarnGrowth_{t-1}. 가속 상위 10분위 롱/하위 숏이 시장조정 수익 1개월 1.8%·1분기 3.4%, 모멘텀·사이즈 팩터와 독립인 알파. 메커니즘 — 투자자가 이익을 계절랜덤워크로 가정해 가속의 예측력을 놓침. 레벨("좋다/나쁘다")이 아니라 궤적의 2차 도함수를 본다.
CF3. 이익의 질 — 매출 주도 vs 비용절감 주도¶
Jegadeesh & Livnat(2006): 매출 서프라이즈를 동반한 이익 서프라이즈가 더 지속적. 매출은 비용보다 동질적·지속적. → revenue_driven 플래그(EPS 서프라이즈와 매출 서프라이즈가 같은 방향·유사 크기)로 가속의 질을 필터. 비용절감만으로 만든 이익 가속은 신뢰도 하향.
CF4. 한국 데이터 현실 — 컨센서스 희소, DART가 강점¶
- 한국은 미국 I/B/E/S 대비 종목당 애널리스트 수가 적음. 중소형주는 커버리지 1~2개 또는 0 → ERR·diffusion·dispersion 표본이 작아 노이즈 큼.
analyst_count<3종목은 리비전 팩터 신뢰도 강제 하향/제외. 컨센서스 기반 신호는 대형주에서만 잘 작동. - 반면 DART 정형 공시(주요사항보고서·소유상황보고서)는 자사주·내부자·M&A·리밸런싱 신호를 안정적으로 파싱 가능 — 한국 이벤트 드리븐의 강점.
- 중소형주는 컨센서스 대신 시계열 기대모형(직전 4분기) + DART 이벤트로 보완.
CF5. 이벤트 드리븐 — 진입 시점이 명시적¶
가격 신호와 달리 이벤트는 "공시 시점 = 정보 충격 시점"이 확정. 이벤트 스터디 CAR(AR=R−(α+β·R_m), CAR=ΣAR)이 공통 토대 — 이벤트 유형별 과거 CAR 분포(평균·표준편차·승률)가 곧 백테스트 priors. 한국 우선순위: 코스피200 정기변경(결정론적·고수익, 2024 상반기 편입-편출 롱숏 15.3%p) > 자사주 소각 > 내부자 클러스터 > M&A > PEAD.
CF6. 정규화 공통 골격 — Round 3·4와 동일¶
대체데이터 전부: YoY → z-score 표준화 → 컨센서스 대조(surprise_score). look-ahead: 대체데이터 짧은 역사(5~10년)·생존편향 통제 필수 → 단독 매매 신호 아닌 확인 신호(confirmation overlay)로 한정.
2. 영역별 핵심 (구현 수치)¶
2-1. 실적 추정 변화 (e1)¶
- ERR(방향):
(상향−하향)/전체 리비전 건수, −1~+1. - Revision Momentum(폭):
(현재 컨센서스 EPS − 3M전)/|3M전 EPS|×100. - Diffusion(일관성):
100×(상향−하향)/(상향+무변동+하향). 소수 폭주 vs 전반 동조 구분. - Dispersion(신뢰가중):
σ(추정치)/|평균 추정치|(변동계수). 분산 클수록 신호 감쇄:최종 = 결합값 × 1/(1+dispersion). - 3축 = 방향·속도(7·14·30·60·90일 다중 윈도우)·폭. StarMine ARM 설계. FQ1 리비전 = 임박도, FY2 = 궤적.
- 한국: FnGuide QuantiWise/스마트컨센서스, WiseReport.
analyst_count≥3필터 필수. - 출처: StarMine ARM, Conference Board diffusion, QuantiWise
2-2. 실적 모멘텀·이익 가속 (e2)¶
- 이익 성장(1차):
EarnGrowth_t = (EPS_t − EPS_{t-4})/Price_{t-1}(계절성 제거 + 종가 스케일링). 8분기 시계열 + slope. - 이익 가속(2차, 핵심):
EarnAccel_t = EarnGrowth_t − EarnGrowth_{t-1}. 2분기 연속 양수 = 가속 지속. - SUE:
(EPS_t−EPS_{t-4})/σ또는(실제−컨센서스)/σ(서프라이즈). SUE 시계열 추세도 본다. - Beat streak: 분기 서프라이즈 부호 누적. 단 기대치 관리(earnings management) 감안.
- revenue_driven 플래그: 매출 서프라이즈 동반 여부 → 가속의 질.
- 출처: He-Narayanamoorthy JAE 2020, Jegadeesh-Livnat Revenue Surprises
2-3. 실적 변곡·턴어라운드·임박 (e3)¶
- 흑자전환 임박:
loss_narrowing=(적자_{t-1}−적자_t)/|적자_{t-1}|, 외삽 →quarters_to_breakeven. 컨센서스 흑자전환 예상 분기 거리. - 영업레버리지:
op_leverage = EPS성장% / 매출성장%(2~3배면 강함).gm_delta_bp_2q(마진 2분기 연속 확대). - 선행지표:
book_to_bill=신규수주/매출(>1 매출증가 임박),backlog_coverage=수주잔고/직전4분기매출. - nowcasting: 고빈도 데이터 → mixed-frequency 회귀 →
nowcast_EPSvsconsensus_EPS갭. - 가이던스:
guidance_delta, 신설/상향/하향 플래그. - →
imminence_score합성. 발견 신호(리비전·B2B·적자축소)와 확인 신호(SUE·가이던스) 분리. - 출처: QuantConnect SUE, Global X 영업레버리지, Panel Nowcasting arXiv:2307.02673, FnGuide 턴어라운드 스크리닝
2-4. 이벤트 드리븐 (e4)¶
- 공통: 이벤트 스터디 CAR. 이벤트 유형별 과거 CAR 분포 = priors.
- 지수 리밸런싱: 편입 발표~실행 +2% 후 반전. 한국 코스피200 정기변경(6·12월) 결정론적. 신호 =
(컷오프 마진)×(예상 패시브 매수금액/20일 거래대금). - 자사주: 매입 발표 +0.9~1.25% AR. 핵심은 소각 — 한국 소각 공시 CAAR ~1% 유지(반전 없음). 단 한국 실제 소각 비율 8.5%.
소각여부×저PBR×첫발표가중. - 내부자: 클러스터 매수(30일 내 임원 2인+)가 단일 대비 2배 알파.
거래금액/연봉 × 클러스터수 × 직급가중. - M&A: 시장내재 성공확률
p=(현재가−실패예상가)/(인수가−실패예상가). - 한국: 전부 DART(rcept_no 단위) 단일 정형 원천.
- 출처: 이벤트 스터디 MacKinlay, Robeco index changes, 내부자 클러스터 Zhao arXiv:2602.06198
2-5. 대체 데이터 (e5)¶
- 유형: 카드결제(가맹점 매출 YoY), 위성영상(주차장 fill_rate YoY), 웹/앱(MAU·DAU/MAU·IAP), 해운 AIS(항만 입항 척수), 채용공고(posting growth QoQ).
- 공통 골격: 패널 보정 → 계절성 제거 → z-score → 컨센서스 대조.
- 선행성: 위성·카드는 발표보다 수주~1개월 선행.
- 한국: 벤더 생태계 얕음 → 무료 소스 중심 — 네이버 데이터랩(검색·쇼핑, 단 상대지수만), DART 텍스트, 공개 AIS(부산·광양항), 채용공고(사람인·잡코리아).
- 함정: 짧은 역사·생존편향·과최적화 → 확인 신호로만.
- 출처: Panel Nowcasting arXiv:2307.02673, 위성-SSS ScienceDirect, 네이버 데이터랩
3. 설계 시사점¶
| # | 시사점 |
|---|---|
| E1 | 매출·전망 신호를 궤적 축 / 임박도 축으로 분리. FQ1 리비전=임박, FY2=궤적 |
| E2 | 발견 신호(선행, 발표 4~8주 전: 리비전·B2B·적자축소·nowcast) ≠ 확인 신호(발표 시점: SUE·가이던스). 필드 분리 |
| E3 | 핵심 차별 신호 = 이익 가속(2차 미분). + revenue_driven 플래그로 가속의 질 필터 |
| E4 | 컨센서스 의존 신호는 analyst_count≥3(대형주)에서만 신뢰. 중소형은 시계열 기대모형 + DART 이벤트 |
| E5 | 한국 이벤트 드리븐은 DART 단일 정형 원천이 강점. 코스피200 정기변경이 가장 검증 가능한 첫 모듈 |
| E6 | 대체데이터는 무료 소스(네이버 데이터랩·DART·공개 AIS·채용공고)로, 확인 신호 overlay로만 |
| E7 | 정규화 공통 골격 YoY→z-score→컨센서스 surprise. 짧은 역사·생존편향 통제 |
4. Round 4 가격 편향 교정 — 종합¶
Round 4 funnel은 가격 신호(모멘텀·RS·돌파·breadth)에 편향됐다. Round 5가 보강한 비(非)가격 통계 엣지: - 매출·전망: 추정치 리비전 / 이익 가속 / 흑자전환 임박 / nowcasting — Round 4 f1의 Value·Quality를 넘어 궤적·임박도로 재구성. - 이벤트: 리밸런싱·자사주·내부자·M&A — Round 4가 이름만 언급한 영역의 수치화 방법론 확보. - 대체데이터: 한국 무료 소스 중심 설계 확보.
→ 발굴 funnel/분석레이어의 입력은 이제 가격(차트·수급) + 매출·전망 + 이벤트 + 대체데이터 4영역이 같은 비중으로 들어간다. statarb(페어·공적분)는 마켓뉴트럴 다른 게임이라 의도적 제외.
다음 (주말 작업): 각 신호를 한국 데이터 가용성에 매핑 — 키움 REST(가격·수급), DART MCP(공시·이벤트·재무), FnGuide/WiseReport(컨센서스), 네이버 데이터랩(대체). 가용한 것부터 분석레이어 스키마에 편입.
부록: 전체 출처¶
추정 리비전: StarMine ARM · Bloomberg ERR · Conference Board diffusion · Causeway · QuantiWise 이익 가속: He-Narayanamoorthy JAE 2020 · NAAIM working paper · Jegadeesh-Livnat · PEAD Wikipedia 변곡·임박: QuantConnect SUE · Global X 영업레버리지 · Book-to-Bill · Panel Nowcasting arXiv:2307.02673 · PEAD.txt Cambridge 이벤트: 이벤트 스터디 · Robeco index changes · 자사주 소각 · 내부자 클러스터 arXiv:2602.06198 · 머지아빗 Alpha Architect · DART 공시 안내 대체데이터: Panel Nowcasting arXiv:2307.02673 · 위성-SSS · Sensor Tower · OECD AIS · 네이버 데이터랩 · 생존편향