콘텐츠로 이동

매출·전망·이벤트·대체데이터 신호 수치화 리서치 (Round 5)

작성: 2026-05-22 | 선행: Round 1~4 주제: 펀더멘털(매출·전망)·기업이벤트·대체데이터를 어떻게 수치화·구조화하는가 배경: Round 4 퀀트 funnel이 가격 신호에 편향됨(5영역 중 3이 가격 파생). 본 라운드가 그 갭 — 매출·전망·이벤트·대체데이터 — 을 보강. 프레임 (PM): 퀀트의 핵심 = 수집 가능한 재료를 수치화해 체계화. 매출에서 알고 싶은 것 = ① 점점 좋아질 것인가(궤적) ② 이익이 목전인가(임박도).


0. 한 줄 결론

매출·전망 신호는 PM의 두 질문으로 정확히 갈린다 — 궤적(좋아지는가)임박도(목전인가). 그리고 발견 신호(발표 4~8주 전 움직이는 선행 — 추정치 리비전·수주잔고·적자축소·nowcast)와 확인 신호(발표 시점 — SUE·가이던스·서프라이즈)를 분리해야 한다. 가장 차별적인 단일 신호는 이익 가속(레벨이 아니라 성장률의 2차 미분). 한국 현실: 컨센서스는 대형주 편중, 대체데이터 벤더 생태계 얕음 → DART 정형 공시(이벤트 드리븐)가 한국에서 가장 안정적인 원천.


1. 핵심 발견 (영역 횡단)

CF1. 매출·전망 신호 = 궤적 축 + 임박도 축

  • 궤적("점점 좋아질 것인가"): 이익 성장률 시계열, 이익 가속, SUE 추세, 리비전 모멘텀, beat streak.
  • 임박도("이익이 목전인가"): 흑자전환 근접도, quarters_to_breakeven, book-to-bill 1.0 돌파, nowcast gap, FQ1(당분기) 추정치 리비전, 가이던스 변화.
  • 두 축은 다른 필드로 분리 보관. FQ1 리비전 = 임박도, FY2 리비전 = 궤적.

CF2. 가장 차별적 신호 = 이익 가속 (2차 미분)

He & Narayanamoorthy(JAE 2020): EarnAccel_t = EarnGrowth_t − EarnGrowth_{t-1}. 가속 상위 10분위 롱/하위 숏이 시장조정 수익 1개월 1.8%·1분기 3.4%, 모멘텀·사이즈 팩터와 독립인 알파. 메커니즘 — 투자자가 이익을 계절랜덤워크로 가정해 가속의 예측력을 놓침. 레벨("좋다/나쁘다")이 아니라 궤적의 2차 도함수를 본다.

CF3. 이익의 질 — 매출 주도 vs 비용절감 주도

Jegadeesh & Livnat(2006): 매출 서프라이즈를 동반한 이익 서프라이즈가 더 지속적. 매출은 비용보다 동질적·지속적. → revenue_driven 플래그(EPS 서프라이즈와 매출 서프라이즈가 같은 방향·유사 크기)로 가속의 질을 필터. 비용절감만으로 만든 이익 가속은 신뢰도 하향.

CF4. 한국 데이터 현실 — 컨센서스 희소, DART가 강점

  • 한국은 미국 I/B/E/S 대비 종목당 애널리스트 수가 적음. 중소형주는 커버리지 1~2개 또는 0 → ERR·diffusion·dispersion 표본이 작아 노이즈 큼. analyst_count<3 종목은 리비전 팩터 신뢰도 강제 하향/제외. 컨센서스 기반 신호는 대형주에서만 잘 작동.
  • 반면 DART 정형 공시(주요사항보고서·소유상황보고서)는 자사주·내부자·M&A·리밸런싱 신호를 안정적으로 파싱 가능 — 한국 이벤트 드리븐의 강점.
  • 중소형주는 컨센서스 대신 시계열 기대모형(직전 4분기) + DART 이벤트로 보완.

CF5. 이벤트 드리븐 — 진입 시점이 명시적

가격 신호와 달리 이벤트는 "공시 시점 = 정보 충격 시점"이 확정. 이벤트 스터디 CAR(AR=R−(α+β·R_m), CAR=ΣAR)이 공통 토대 — 이벤트 유형별 과거 CAR 분포(평균·표준편차·승률)가 곧 백테스트 priors. 한국 우선순위: 코스피200 정기변경(결정론적·고수익, 2024 상반기 편입-편출 롱숏 15.3%p) > 자사주 소각 > 내부자 클러스터 > M&A > PEAD.

CF6. 정규화 공통 골격 — Round 3·4와 동일

대체데이터 전부: YoY → z-score 표준화 → 컨센서스 대조(surprise_score). look-ahead: 대체데이터 짧은 역사(5~10년)·생존편향 통제 필수 → 단독 매매 신호 아닌 확인 신호(confirmation overlay)로 한정.


2. 영역별 핵심 (구현 수치)

2-1. 실적 추정 변화 (e1)

  • ERR(방향): (상향−하향)/전체 리비전 건수, −1~+1.
  • Revision Momentum(폭): (현재 컨센서스 EPS − 3M전)/|3M전 EPS|×100.
  • Diffusion(일관성): 100×(상향−하향)/(상향+무변동+하향). 소수 폭주 vs 전반 동조 구분.
  • Dispersion(신뢰가중): σ(추정치)/|평균 추정치|(변동계수). 분산 클수록 신호 감쇄: 최종 = 결합값 × 1/(1+dispersion).
  • 3축 = 방향·속도(7·14·30·60·90일 다중 윈도우)·폭. StarMine ARM 설계. FQ1 리비전 = 임박도, FY2 = 궤적.
  • 한국: FnGuide QuantiWise/스마트컨센서스, WiseReport. analyst_count≥3 필터 필수.
  • 출처: StarMine ARM, Conference Board diffusion, QuantiWise

2-2. 실적 모멘텀·이익 가속 (e2)

  • 이익 성장(1차): EarnGrowth_t = (EPS_t − EPS_{t-4})/Price_{t-1} (계절성 제거 + 종가 스케일링). 8분기 시계열 + slope.
  • 이익 가속(2차, 핵심): EarnAccel_t = EarnGrowth_t − EarnGrowth_{t-1}. 2분기 연속 양수 = 가속 지속.
  • SUE: (EPS_t−EPS_{t-4})/σ 또는 (실제−컨센서스)/σ(서프라이즈). SUE 시계열 추세도 본다.
  • Beat streak: 분기 서프라이즈 부호 누적. 단 기대치 관리(earnings management) 감안.
  • revenue_driven 플래그: 매출 서프라이즈 동반 여부 → 가속의 질.
  • 출처: He-Narayanamoorthy JAE 2020, Jegadeesh-Livnat Revenue Surprises

2-3. 실적 변곡·턴어라운드·임박 (e3)

  • 흑자전환 임박: loss_narrowing=(적자_{t-1}−적자_t)/|적자_{t-1}|, 외삽 → quarters_to_breakeven. 컨센서스 흑자전환 예상 분기 거리.
  • 영업레버리지: op_leverage = EPS성장% / 매출성장% (2~3배면 강함). gm_delta_bp_2q(마진 2분기 연속 확대).
  • 선행지표: book_to_bill=신규수주/매출(>1 매출증가 임박), backlog_coverage=수주잔고/직전4분기매출.
  • nowcasting: 고빈도 데이터 → mixed-frequency 회귀 → nowcast_EPS vs consensus_EPS 갭.
  • 가이던스: guidance_delta, 신설/상향/하향 플래그.
  • imminence_score 합성. 발견 신호(리비전·B2B·적자축소)와 확인 신호(SUE·가이던스) 분리.
  • 출처: QuantConnect SUE, Global X 영업레버리지, Panel Nowcasting arXiv:2307.02673, FnGuide 턴어라운드 스크리닝

2-4. 이벤트 드리븐 (e4)

  • 공통: 이벤트 스터디 CAR. 이벤트 유형별 과거 CAR 분포 = priors.
  • 지수 리밸런싱: 편입 발표~실행 +2% 후 반전. 한국 코스피200 정기변경(6·12월) 결정론적. 신호 = (컷오프 마진)×(예상 패시브 매수금액/20일 거래대금).
  • 자사주: 매입 발표 +0.9~1.25% AR. 핵심은 소각 — 한국 소각 공시 CAAR ~1% 유지(반전 없음). 단 한국 실제 소각 비율 8.5%. 소각여부×저PBR×첫발표 가중.
  • 내부자: 클러스터 매수(30일 내 임원 2인+)가 단일 대비 2배 알파. 거래금액/연봉 × 클러스터수 × 직급가중.
  • M&A: 시장내재 성공확률 p=(현재가−실패예상가)/(인수가−실패예상가).
  • 한국: 전부 DART(rcept_no 단위) 단일 정형 원천.
  • 출처: 이벤트 스터디 MacKinlay, Robeco index changes, 내부자 클러스터 Zhao arXiv:2602.06198

2-5. 대체 데이터 (e5)

  • 유형: 카드결제(가맹점 매출 YoY), 위성영상(주차장 fill_rate YoY), 웹/앱(MAU·DAU/MAU·IAP), 해운 AIS(항만 입항 척수), 채용공고(posting growth QoQ).
  • 공통 골격: 패널 보정 → 계절성 제거 → z-score → 컨센서스 대조.
  • 선행성: 위성·카드는 발표보다 수주~1개월 선행.
  • 한국: 벤더 생태계 얕음 → 무료 소스 중심 — 네이버 데이터랩(검색·쇼핑, 단 상대지수만), DART 텍스트, 공개 AIS(부산·광양항), 채용공고(사람인·잡코리아).
  • 함정: 짧은 역사·생존편향·과최적화 → 확인 신호로만.
  • 출처: Panel Nowcasting arXiv:2307.02673, 위성-SSS ScienceDirect, 네이버 데이터랩

3. 설계 시사점

# 시사점
E1 매출·전망 신호를 궤적 축 / 임박도 축으로 분리. FQ1 리비전=임박, FY2=궤적
E2 발견 신호(선행, 발표 4~8주 전: 리비전·B2B·적자축소·nowcast) ≠ 확인 신호(발표 시점: SUE·가이던스). 필드 분리
E3 핵심 차별 신호 = 이익 가속(2차 미분). + revenue_driven 플래그로 가속의 질 필터
E4 컨센서스 의존 신호는 analyst_count≥3(대형주)에서만 신뢰. 중소형은 시계열 기대모형 + DART 이벤트
E5 한국 이벤트 드리븐은 DART 단일 정형 원천이 강점. 코스피200 정기변경이 가장 검증 가능한 첫 모듈
E6 대체데이터는 무료 소스(네이버 데이터랩·DART·공개 AIS·채용공고)로, 확인 신호 overlay로만
E7 정규화 공통 골격 YoY→z-score→컨센서스 surprise. 짧은 역사·생존편향 통제

4. Round 4 가격 편향 교정 — 종합

Round 4 funnel은 가격 신호(모멘텀·RS·돌파·breadth)에 편향됐다. Round 5가 보강한 비(非)가격 통계 엣지: - 매출·전망: 추정치 리비전 / 이익 가속 / 흑자전환 임박 / nowcasting — Round 4 f1의 Value·Quality를 넘어 궤적·임박도로 재구성. - 이벤트: 리밸런싱·자사주·내부자·M&A — Round 4가 이름만 언급한 영역의 수치화 방법론 확보. - 대체데이터: 한국 무료 소스 중심 설계 확보.

→ 발굴 funnel/분석레이어의 입력은 이제 가격(차트·수급) + 매출·전망 + 이벤트 + 대체데이터 4영역이 같은 비중으로 들어간다. statarb(페어·공적분)는 마켓뉴트럴 다른 게임이라 의도적 제외.

다음 (주말 작업): 각 신호를 한국 데이터 가용성에 매핑 — 키움 REST(가격·수급), DART MCP(공시·이벤트·재무), FnGuide/WiseReport(컨센서스), 네이버 데이터랩(대체). 가용한 것부터 분석레이어 스키마에 편입.


부록: 전체 출처

추정 리비전: StarMine ARM · Bloomberg ERR · Conference Board diffusion · Causeway · QuantiWise 이익 가속: He-Narayanamoorthy JAE 2020 · NAAIM working paper · Jegadeesh-Livnat · PEAD Wikipedia 변곡·임박: QuantConnect SUE · Global X 영업레버리지 · Book-to-Bill · Panel Nowcasting arXiv:2307.02673 · PEAD.txt Cambridge 이벤트: 이벤트 스터디 · Robeco index changes · 자사주 소각 · 내부자 클러스터 arXiv:2602.06198 · 머지아빗 Alpha Architect · DART 공시 안내 대체데이터: Panel Nowcasting arXiv:2307.02673 · 위성-SSS · Sensor Tower · OECD AIS · 네이버 데이터랩 · 생존편향