HANGUL.WIKI

DeepSeek (중국 AI 스타트업)

DeepSeek (Chinese AI Startup)

번역 제공
2,949자 · 2026-04-28
목차 (10개 섹션)

DeepSeek (중국 AI 스타트업)

2025년 1월, 글로벌 AI 업계에 폭탄이 하나 떨어졌다. 중국의 무명 스타트업 DeepSeek(딥시크)이 내놓은 모델 DeepSeek-R1이 오픈AI의 최신 추론 모델 o1과 비슷한 성능을 보였기 때문이다. 충격은 거기서 끝나지 않았다 — 훈련 비용이 채 600만 달러도 안 됐다고 발표하면서 전 세계 AI 업계가 뒤집어졌다. "저비용 고성능 AI 시대가 왔다"는 평가와 "중국에 추격당했다"는 경계심이 동시에 폭발했다.

1. 회사 배경: 헤지펀드에서 AI로

DeepSeek은 원래 AI 회사가 아니었다. 중국 양퀀트(幻方科技, High-Flyer)라는 헤지펀드가 모회사다. 2021년부터 자체 AI 연구팀을 운영하다가 2023년 독립 법인으로 분리해 DeepSeek을 설립했다. 창업자 량원평(梁文锋)은 저장대 출신의 AI 연구자 겸 투자자다.

주목할 점은 DeepSeek이 처음부터 연구 중심으로 출발했다는 것이다. 단기 수익보다 기술 논문 발표와 모델 공개를 우선시하며 오픈소스 커뮤니티에서 빠르게 존재감을 키웠다.

2. DeepSeek-V2: 효율성의 선언

2024년 5월 공개된 DeepSeek-V2는 AI 업계에 첫 번째 충격을 줬다. MoE(Mixture of Experts) 아키텍처를 채택해 전체 파라미터 수는 236B(2360억)지만, 실제 추론 시 활성화되는 파라미터는 21B에 불과하다. 덕분에 추론 비용을 기존 모델 대비 최대 5배 절감했다.

MoE는 쉽게 말하면 "전문가 여럿을 모아놓고, 문제에 따라 필요한 전문가만 부른다"는 아이디어다. 수학 문제면 수학 전문가만 활성화, 번역이면 언어 전문가만 활성화하는 방식이다.

이 모델의 API 가격이 GPT-4 수준 성능에 비해 수십 분의 일 수준으로 공개되자, 중국 AI 시장에서 "가격 전쟁"이 시작됐다. 알리바바 Qwen, 바이두 ERNIE 등 경쟁사들이 잇따라 가격을 내렸다.

3. DeepSeek-R1: 세계를 흔든 논문

2025년 1월 공개된 DeepSeek-R1은 단순한 모델이 아니라 "새로운 훈련 방법론"의 증명이었다.

핵심은 순수 강화학습(Pure RL)으로 추론 능력을 키울 수 있다는 것. 기존 추론 모델들은 대규모 지도학습(SFT) 데이터로 훈련한 뒤 RL을 보조로 썼다. R1은 거의 SFT 없이 RL만으로 수학·코딩·논리 추론에서 OpenAI o1 수준을 달성했다고 발표했다 [DeepSeek-AI, 2025.01].

훈련 비용 600만 달러라는 수치는 큰 논란을 불렀다. "실제로 그게 전부냐?"는 의심이 쏟아졌다. 연구자들은 베이스 모델 훈련 비용, 인프라 비용 등을 포함하면 실제 비용은 훨씬 높을 것이라고 반박했다. 그럼에도 OpenAI, Google이 수십억 달러를 쓰는 것과 비교하면 현저히 낮은 수준임은 부정하기 어렵다.

4. 나스닥의 공포: 엔비디아 주가 폭락

DeepSeek-R1 발표 직후인 2025년 1월 27일, 미국 증시에서 엔비디아 주가가 하루 만에 17% 폭락했다. 시가총액 5,900억 달러(약 830조 원) 증발. AI 인프라 투자의 핵심인 GPU를 엔비디아가 공급하는데, "저비용 AI가 가능하다면 엔비디아 칩이 그렇게 많이 필요 없을 수도 있다"는 공포가 시장을 덮쳤다.

이는 단순한 주가 변동이 아니라 AI 투자 패러다임 전환의 신호탄으로 읽혔다. "더 많은 칩 = 더 좋은 AI"라는 공식이 흔들리기 시작한 것이다.

5. 지정학적 맥락: 미국의 반도체 수출 규제

DeepSeek의 성과를 이해하려면 미-중 반도체 갈등을 알아야 한다. 미국은 2022년부터 중국에 고성능 AI 칩(엔비디아 A100, H100 등) 수출을 규제했다. 중국 AI 기업들은 최신 GPU 없이 연구를 이어가야 했다.

DeepSeek도 제재 대상인 H100 대신 H800(성능 제한 버전)이나 A100을 사용한 것으로 알려졌다. 역설적으로, 이 제약이 "제한된 자원으로 최고 효율을 뽑는" 연구 방향을 자극했다는 분석이 있다. 제한이 혁신을 낳은 셈이다.

6. 오픈소스 전략과 중국 AI의 소프트파워

DeepSeek은 모델 가중치를 공개(오픈소스)했다. MIT 라이선스로 누구나 다운로드하고, 수정하고, 상업적으로 활용할 수 있다. 이는 중국 AI 기업 최초의 대규모 오픈소스 공세였다.

오픈소스 전략은 여러 목적을 동시에 달성한다: 글로벌 개발자 커뮤니티의 기술 검증과 홍보를 동시에 얻고, 서방 클로즈드 모델(GPT, Claude) 대비 투명성 이미지를 구축하며, 중국 AI의 국제적 신뢰도를 높인다.

7. 논란: 검열과 데이터 안전

DeepSeek에는 명확한 한계가 있다. 텐안먼 사태, 대만 독립, 신장 위구르 등 중국 정부에 민감한 주제에 대해 답변을 거부하거나 중국 정부 공식 입장을 그대로 반복한다. 이는 중국 내 인터넷 규제와 연동된 훈련 데이터의 결과다.

또한 DeepSeek 앱을 통해 입력된 대화 데이터가 중국 서버에 저장된다는 점이 프라이버시 우려를 낳았다. 이탈리아는 2025년 초 DeepSeek 앱을 일시 차단했고, 미국 내에서도 정부 기관 사용 금지 논의가 이어졌다.

향후 전망

DeepSeek는 AI 군비경쟁의 판도를 바꿨다. "거대 자본과 엄청난 칩이 있어야만 최고 AI를 만들 수 있다"는 통념을 흔들었다. 이제 AI 업계는 "효율성"이라는 새로운 전선에서 경쟁한다. 중국 AI의 기술력이 서방과 동등하거나 일부에서 앞선다는 것이 증명된 이상, AI 패권 경쟁은 더욱 치열해질 전망이다.

관련 항목

Claude (Anthropic AI 모델), LLM (대규모 언어 모델), 엔비디아, AI 반도체, 미중 기술 패권, 오픈소스 AI, 강화학습, Gemini (Google AI 모델), MoE 아키텍처, AI 안전성

문서 정보

최초 작성
최종 갱신
분량
2,949자 (성인 기준)
분류
과학·기술

HANGUL.WIKI가 정리·작성한 문서입니다. 정확성을 위해 노력하나 오류가 있을 수 있으므로, 중요한 내용은 공식 출처를 통해 확인하시기 바랍니다. 내용의 오류나 정정 요청은 오류·정정 신고로 알려주시면 검토 후 반영합니다.