BDAI FinDA 금융 데이터 분석 심화 과정

금융 데이터는 무엇을 측정해야 하는가

cheshire5 2026. 1. 19. 10:23

금융 데이터 사이언티스트 관점에서 본 미국 전략 자료 정리

0. 핵심 관점 정리

본 자료는 정치·외교 분석처럼 보이나, 실제로는 금융 데이터가 무엇을 측정하고 예측해야 하는지에 대한 힌트를 다량 포함한다.

중심 키워드는 효율(efficiency)이 아니라 통제(control)이며, 이는 금융 데이터 분석에서 다음과 같이 해석된다.

  • 평균 성장률 예측보다 변곡점·위기 신호 조기 탐지
  • 단일 지표보다 구조적 연결 관계 분석
  • 수익률 예측보다 행동 제약과 선택권 변화 감지

1. 관세와 무역 정책 → 금융 데이터 관점 재해석

1.1 관세는 ‘세금 변수’가 아니라 ‘행동 충격 변수’

관세는 재정 수입 변수가 아니라 기업·국가의 의사결정 함수를 강제로 이동시키는 외생 충격 변수다.

금융 데이터 관점에서의 해석:

  • 관세 발표 시점 = 구조적 브레이크포인트
  • 주가·환율보다 중요한 것은 거래량, 공급망 재배치, 수입선 다변화 지표
  • 단기 가격 반응보다 중기 분산 변화(variance shift)가 중요
    • 중기 분산 변화의 정확 의미1. 의미 정리가격의 평균 이동(mean shift)보다
      • 단기 가격 반응
      • → 이벤트 직후의 수익률 방향(↑↓)
      • 중기 분산 변화
      • → 이벤트 이후 일정 기간 동안 변동성 수준이 달라졌는지
    • 가격 변동성 구조가 바뀌었는지가 더 중요한 신호라는 의미다.
    • “단기 가격 반응보다 중기 분산 변화가 중요”하다는 말은
    • “중기 분산 변화(variance shift)”의 정확한 의미

1.2 분석적으로 중요한 질문

  • 관세 발표 이후 특정 산업의 수입국 집중도(HHI) 변화
  • 관세 부과 전후 기업별 원가 구조 민감도
  • 관세 뉴스 이후 기업 실적 가이던스 수정 빈도

→ 이벤트 스터디 + 구조 변화 탐지 문제로 귀결


2. 자원(에너지·희토류) → 가격이 아니라 ‘선택권 데이터’

2.1 자원은 현물 가격보다 ‘옵션 가치’

자원은 현재 생산량보다 미래에 꺼낼 수 있는 선택권(real option)으로 해석된다.

금융 데이터 사이언스 관점:

  • 자원 보유국 = 잠재 공급자
  • 시장의 핵심은 “얼마나 생산하나”가 아니라
  • “언제 생산을 늘릴 수 있나”

2.2 중요한 분석 대상

  • 유가·광물 가격 수준보다 spare capacity
  • 생산량보다 생산 전환 속도
  • 자원국 정치 리스크와 글로벌 변동성(VIX) 간 선행 관계

→ 시계열 예측 문제가 아니라 옵션성·비대칭 리스크 분석 문제


3. 미국 전략의 공통 구조 → 금융 모델링 힌트

3.1 ‘직접 소유’가 아니라 ‘구조 통제’

미국은 자산을 직접 보유하기보다 가격 결정, 결제, 보험, 규칙을 통제한다.

금융 데이터로 번역하면:

  • 자산 수익률보다 거래 인프라 데이터
  • 기업 실적보다 결제·정산·보험·운송 데이터
  • 소득보다 흐름(flow)과 마찰(friction)

3.2 데이터 분석 시 중요한 관점

  • GDP, 무역액 → 결과 변수
  • 결제 통화, 보험 조건, 운송 경로 → 원인 변수
  • “얼마나 벌었나”보다 “어디를 반드시 거쳐야 하나”

4. 스테이블코인 → ‘암호화폐’가 아니라 ‘금융 센서’

*기존 암호화폐의 가격 변동성 없애고, 달러나 원화같은 특정 법정화폐의 가치에 1:1 연동되도록 설계된 암호화폐

4.1 스테이블코인의 본질

스테이블코인은 탈달러 자산이 아니라 프로그래머블 달러 인터페이스다.

금융 데이터 관점 핵심:

  • 자산 클래스가 아니라 결제 로그 데이터
  • 투자 대상이 아니라 행동 데이터 스트림

4.2 기존 금융 데이터와의 차이

구분 전통 금융 스테이블코인
시간 해상도 일·월 단위 초·분 단위
접근성 폐쇄적 공개/준공개
국경 국가별 글로벌
지연 거의 없음

→ 스테이블코인은 글로벌 달러 수요의 실시간 센서


5. 스테이블코인 데이터로 가능한 분석 주제

5.1 글로벌 리스크 조기 탐지

  • 특정 국가/지역에서 USDT·USDC 거래량 급증
  • 체인 간 브리지 이동 증가
  • 법정통화 약세보다 선행 신호로 작동

5.2 금리 정책 민감도 분석

  • 금리 인상기: 스테이블코인 잔고 변화
  • DeFi 예치 이동 → 위험 선호 변화
  • 연준 발표 이전에 나타나는 행동 기반 시그널

5.3 제재·자본 통제 회피 패턴

  • 특정 시간대 대형 트랜잭션 집중
  • 믹서·DEX·브리지 사용 급증
  • 지정학 리스크 데이터로 활용 가능

6. 디페깅(de-peg) 연구 → 예측 문제가 아닌 ‘리스크 모니터링 문제’

6.1 디페깅 예측의 한계

*stable coing 가격 고정되어 있어야 할 목표 가치에서 벗어나는 현상 ex) 1dollar에 고정되어야 하는 USDT(암호화폐 stable coin)나 USDC(USD에 1:1로 연동되는 stable coin)가 0.95, 1.05로 거래되는 상황

  • 정상 상태가 대부분(극단적 클래스 불균형)
  • 핵심 데이터(order book, 준비금 실시간)는 비공개
  • 가격 데이터만으로는 한계 명확

→ 정확한 시점 예측 문제는 비현실적

6.2 현실적인 문제 재정의

  • “언제 깨질까?” → “위험이 높아지고 있는가?”
  • 회귀/예측 → 조기경보(Early Warning System)
  • 목표는 정확도보다 리스크 순위화

6.3 데이터 사이언스적으로 유의미한 접근

  • 온체인 지표 + 오프체인 지표 결합
  • 가격이 아니라 유동성·담보·심리 지표
  • 분류(classification), 이상치 탐지, 체인지포인트 분석

7. 금융 데이터 사이언티스트가 가져가야 할 핵심 교훈

7.1 문제 정의 관점

  • 평균 수익률 예측 → 구조 변화 탐지
  • 정상 상태 모델링 → 극단 상황 대비
  • 결과 변수 중심 → 제약 조건·행동 공간 중심

7.2 데이터 관점

  • 가격 데이터 < 흐름(flow) 데이터
  • 회계 데이터 < 결제·이동 로그
  • 사후 통계 < 실시간 행동 데이터

7.3 모델링 관점

  • 정밀 예측보다 조기 신호 감지
  • 단일 모델보다 리스크 지수·스코어링
  • 설명력보다 운영 가능성(operational usefulness)

8. 정리

이 자료의 핵심 메시지는 정치가 아니라 다음과 같다.

금융 시장에서 중요한 것은

“얼마나 성장했는가”가 아니라

누가 언제 무엇을 선택할 수 있는가”다.

금융 데이터 사이언티스트의 역할은

가격을 맞히는 사람이 아니라

구조가 바뀌는 순간을 가장 먼저 감지하는 사람이다.


Deep dive into real project


Depeg

Depeg(stable coin이 연동된 특정 자산의 가치와 동일한 비율을 유지하지 못하고 가치 변동)

⇒ 언제 무너질지를 맞추는게 아니라 디페깅 확률이 높아지는 조짐이 있는가를 확률적 신호로 탐지


Synthetic Data

● 사건 데이터가 부족하면, 시뮬레이션으로 extreme scenario를 합성해서 모델 학습

✔ Stablecoin stress scenario generator

  • Simulation 기반 가상 시장에서 peg breakdown 실험 → 정책적 시사점.

✔ Cross-market arbitrage monitoring

  • Stablecoin이 여러
    CEX (centralized exchange: 중앙화된 거래소, 사용자 자금을 맡고 KYC 수행) /
    DEX (사용자가 직접 개인 지갑을 연결해 거래하며 자금을 통제하는 거래소)
    에 상장돼 있을 때
    가격 차이와 유동성 흐름 추적 → arbitrage(차익거래) window 탐지.

✔ Dynamic reserve adequacy score

  • Depeg 확률을 담보율, 은행 파산, fiat redemption demand로 추정

왜 CEX–DEX 가격 차이를 보면 depeg 탐지가 되나?

👉 depeg은 ‘기준 가치(peg)’에서 벗어났느냐의 문제

👉 CEX–DEX 가격 차이는 depeg의 조기 신호 또는 전파 경로

에 가깝다.

전형적인 패턴

  1. 온체인 리스크 발생
    • 준비금 루머
    • 브릿지 해킹
    • 담보 자산 급락
  2. DEX 유동성 풀에서:
    • 사람들이 stablecoin을 먼저 던짐
    • 풀 비대칭 → 가격 하락
  3. DEX 가격 < 1 USD
  4. CEX는:
    • 아직 MM·회계·정책 때문에 가격 유지
  5. CEX–DEX 가격 괴리 확대
  6. 차익거래 시도 → 유동성 이동
  7. 괴리가 수렴하면 정상
  8. 괴리가 유지되면 → depeg 확정

현실성 고려

  • 디페깅 예측 보다는 → 조기 경보
    Early Warning System or Stress Test Tool로 축소
  • 실거래 데이터 대신 → 합성 시뮬레이션 + 공개 사건 데이터로 연구
  • 단일 price만 말고 →
    담보율, twitter, on-chain reserve 변화까지 함께 쓰는 다중 feature

직접적 실시간 예측 대신 아래 3가지 방식으로 연구 수행


1. 사후 분석 (Post-mortem Analysis)

실제로 디페깅이 발생한
과거 사건(예: Terra UST, USDC-SVB 사태)
정책적, 구조적 관점에서 분석

  • 디페깅 전 유동성 변화
  • 담보금 비율 변화
  • 대형 트랜잭션 (whale dump)
  • 트위터 FUD 확산 시점
  • 스테이블코인 redemption 트랜잭션 급증

같은 설명변수(feature) 를 사후적으로 모아 패턴 도출

장점

  • 데이터 부족 문제 없음 (사건 직전 데이터만 확보하면 됨)
  • 구조 요인, 거버넌스 요인 분석 가능
  • 학계에서는
    ‘리스크 인디케이터 설계’, ‘감독정책 시사점’ 논문으로 많이 활용

2. Simulation & Agent-Based Modeling

실제 데이터 부족 → 가상 디페깅 상황 모델링

대표적 방법:

  • 담보 비율이 점진적으로 하락하는 가상 시나리오
  • DeFi pool에서 bank run이 발생하는 agent-based simulation
  • 대규모 redemption 발생 시 유동성 고갈 속도 계산

예:

An Agent-Based Model of Stablecoin Depegging under Liquidity Shock

NetLogo, Python SimPy, custom simulator로
가상 시장을 만들고 디페깅 확률과 위험요소 민감도 분석

장점

  • 데이터 의존도 낮음
  • extreme case 실험 가능
  • 정책·감독 연구에 적합

3. Early Warning System

‘디페깅을 정확히 맞춘다’가 아니라
디페깅 리스크가 높아지는 징후를 감지

실제 금융감독기구가 선호하는 접근

종합 risk index 구성 예:

  • On-chain: 담보 reserve 잔고, 대규모 트랜잭션
  • Off-chain: CEX/DEX 가격 괴리, order book depth
  • Sentiment: 뉴스/트위터 공포지수
  • Ground truth: 디페깅 발생 시점
  • 모델 목적: 리스크 경보를 조기 발화

→ Classification (High / Low Risk)
→ Changepoint detection


연구자로서의 실전 전략

  1. 데이터가 없는 걸 피하지 말고, 왜 없는지를 논문에 담는다
  2. 사건 중심 post-mortem을 통해
    앞으로 공개돼야 할 데이터를 정책 제언으로 연결
  3. 예측모델보다 조기 경보 스코어링 모델을 현실성 있게 설계
  4. 부족한 실데이터는 시뮬레이션으로 보완

Example Observation

BIS (2022)

https://www.bis.org/publ/qtrpdf/r_qt2209b.htm

실시간 디페깅 예측은 데이터와 사건 수가 극도로 제한됨
→ 대신 위험 신호를 조기 탐지하는 스코어링 모델 연구가 활발

Aramonte, Huang, Schrimpf (2022):

  • DeFi 대출 시장의 정보 비대칭 문제 지적
  • 실거래 데이터 확보 한계 인정
  • 담보 비율, 온체인 풀 유동성, 차입–대출 비율 등으로
    단순 조기경보 지표 설계
  • 감독당국·투자자 실무 활용 방안 제시

Gorton & Zhang (2022)

https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3888752

「Taming Wildcat Stablecoins」

  • 담보·유동성 정보 비공개 문제 제기
  • Terra UST 디페깅 사례 기반 분석
  • 발행사의 담보·회계 감사 공개 부족 비판
  • 규제를 통한 해결 필요성 주장

데이터 부족 자체를 연구의 핵심 논점으로 설정
→ 향후 데이터 공개 수준과 감독 체계 제안


Eichengreen & Viswanath-Natraj (2022)

IMF 보고서

  • UST, USDC 디페깅 사례 구조적 분석
  • 담보율, 유동성, 거래소 간 가격 괴리만으로도
    중요한 설명력 확보 가능함을 제시
  • 데이터 부족·정보 비대칭이 리스크를 증폭시킴을 지적
  • 정책당국의 규제 프레임 필요성 강조

사후 분석을 통해 재발 방지 + 데이터 투명성 강화로 연결