2025년 1월, 글로벌 AI 업계에 폭탄이 하나 떨어졌다. 중국의 무명 스타트업 DeepSeek(딥시크)이 내놓은 모델 DeepSeek-R1이 오픈AI의 최신 추론 모델 o1과 비슷한 성능을 보였기 때문이다. 충격은 거기서 끝나지 않았다 — 훈련 비용이 채 600만 달러도 안 됐다고 발표하면서 전 세계 AI 업계가 뒤집어졌다. "저비용 고성능 AI 시대가 왔다"는 평가와 "중국에 추격당했다"는 경계심이 동시에 폭발했다.
1. 회사 배경: 헤지펀드에서 AI로
DeepSeek은 원래 AI 회사가 아니었다. 중국 양퀀트(幻方科技, High-Flyer)라는 헤지펀드가 모회사다. 2021년부터 자체 AI 연구팀을 운영하다가 2023년 독립 법인으로 분리해 DeepSeek을 설립했다. 창업자 량원평(梁文锋)은 저장대 출신의 AI 연구자 겸 투자자다.
주목할 점은 DeepSeek이 처음부터 연구 중심으로 출발했다는 것이다. 단기 수익보다 기술 논문 발표와 모델 공개를 우선시하며 오픈소스 커뮤니티에서 빠르게 존재감을 키웠다.
2. DeepSeek-V2: 효율성의 선언
2024년 5월 공개된 DeepSeek-V2는 AI 업계에 첫 번째 충격을 줬다. MoE(Mixture of Experts) 아키텍처를 채택해 전체 파라미터 수는 236B(2360억)지만, 실제 추론 시 활성화되는 파라미터는 21B에 불과하다. 덕분에 추론 비용을 기존 모델 대비 최대 5배 절감했다.
MoE는 쉽게 말하면 "전문가 여럿을 모아놓고, 문제에 따라 필요한 전문가만 부른다"는 아이디어다. 수학 문제면 수학 전문가만 활성화, 번역이면 언어 전문가만 활성화하는 방식이다.
이 모델의 API 가격이 GPT-4 수준 성능에 비해 수십 분의 일 수준으로 공개되자, 중국 AI 시장에서 "가격 전쟁"이 시작됐다. 알리바바 Qwen, 바이두 ERNIE 등 경쟁사들이 잇따라 가격을 내렸다.
3. DeepSeek-R1: 세계를 흔든 논문
2025년 1월 공개된 DeepSeek-R1은 단순한 모델이 아니라 "새로운 훈련 방법론"의 증명이었다.
핵심은 순수 강화학습(Pure RL)으로 추론 능력을 키울 수 있다는 것. 기존 추론 모델들은 대규모 지도학습(SFT) 데이터로 훈련한 뒤 RL을 보조로 썼다. R1은 거의 SFT 없이 RL만으로 수학·코딩·논리 추론에서 OpenAI o1 수준을 달성했다고 발표했다 [DeepSeek-AI, 2025.01].
훈련 비용 600만 달러라는 수치는 큰 논란을 불렀다. "실제로 그게 전부냐?"는 의심이 쏟아졌다. 연구자들은 베이스 모델 훈련 비용, 인프라 비용 등을 포함하면 실제 비용은 훨씬 높을 것이라고 반박했다. 그럼에도 OpenAI, Google이 수십억 달러를 쓰는 것과 비교하면 현저히 낮은 수준임은 부정하기 어렵다.
4. 나스닥의 공포: 엔비디아 주가 폭락
DeepSeek-R1 발표 직후인 2025년 1월 27일, 미국 증시에서 엔비디아 주가가 하루 만에 17% 폭락했다. 시가총액 5,900억 달러(약 830조 원) 증발. AI 인프라 투자의 핵심인 GPU를 엔비디아가 공급하는데, "저비용 AI가 가능하다면 엔비디아 칩이 그렇게 많이 필요 없을 수도 있다"는 공포가 시장을 덮쳤다.
이는 단순한 주가 변동이 아니라 AI 투자 패러다임 전환의 신호탄으로 읽혔다. "더 많은 칩 = 더 좋은 AI"라는 공식이 흔들리기 시작한 것이다.
5. 지정학적 맥락: 미국의 반도체 수출 규제
DeepSeek의 성과를 이해하려면 미-중 반도체 갈등을 알아야 한다. 미국은 2022년부터 중국에 고성능 AI 칩(엔비디아 A100, H100 등) 수출을 규제했다. 중국 AI 기업들은 최신 GPU 없이 연구를 이어가야 했다.
DeepSeek도 제재 대상인 H100 대신 H800(성능 제한 버전)이나 A100을 사용한 것으로 알려졌다. 역설적으로, 이 제약이 "제한된 자원으로 최고 효율을 뽑는" 연구 방향을 자극했다는 분석이 있다. 제한이 혁신을 낳은 셈이다.
6. 오픈소스 전략과 중국 AI의 소프트파워
DeepSeek은 모델 가중치를 공개(오픈소스)했다. MIT 라이선스로 누구나 다운로드하고, 수정하고, 상업적으로 활용할 수 있다. 이는 중국 AI 기업 최초의 대규모 오픈소스 공세였다.
오픈소스 전략은 여러 목적을 동시에 달성한다: 글로벌 개발자 커뮤니티의 기술 검증과 홍보를 동시에 얻고, 서방 클로즈드 모델(GPT, Claude) 대비 투명성 이미지를 구축하며, 중국 AI의 국제적 신뢰도를 높인다.
7. 논란: 검열과 데이터 안전
DeepSeek에는 명확한 한계가 있다. 텐안먼 사태, 대만 독립, 신장 위구르 등 중국 정부에 민감한 주제에 대해 답변을 거부하거나 중국 정부 공식 입장을 그대로 반복한다. 이는 중국 내 인터넷 규제와 연동된 훈련 데이터의 결과다.
또한 DeepSeek 앱을 통해 입력된 대화 데이터가 중국 서버에 저장된다는 점이 프라이버시 우려를 낳았다. 이탈리아는 2025년 초 DeepSeek 앱을 일시 차단했고, 미국 내에서도 정부 기관 사용 금지 논의가 이어졌다.
향후 전망
DeepSeek는 AI 군비경쟁의 판도를 바꿨다. "거대 자본과 엄청난 칩이 있어야만 최고 AI를 만들 수 있다"는 통념을 흔들었다. 이제 AI 업계는 "효율성"이라는 새로운 전선에서 경쟁한다. 중국 AI의 기술력이 서방과 동등하거나 일부에서 앞선다는 것이 증명된 이상, AI 패권 경쟁은 더욱 치열해질 전망이다.
2025년 1월에 AI 업계에 핵폭탄급 사건이 있었음. 중국 스타트업 DeepSeek이 GPT 최신 버전이랑 맞먹는 AI를 아주 싼 가격에 만들어서 공개했거든. 미국 증시에서 엔비디아 주가가 하루에 17% 폭락할 정도로 충격이 컸음. "AI 강대국은 미국"이라는 공식이 하루아침에 흔들린 사건임.
뭐가 충격이었냐면
OpenAI가 GPT-4 만들 때 수백억 달러 썼는데, DeepSeek은 비슷한 성능 AI를 단 600만 달러(약 85억 원)로 만들었다고 발표함. 업계 반응은 "이게 가능하다고??" 였음.
심지어 오픈소스로 공개해서 누구나 다운받아 쓸 수 있음. MIT 라이선스라 상업적으로도 써도 됨. GPT는 유료인데 이건 무료라는 것도 포인트.
회사 배경
DeepSeek은 원래 헤지펀드(주식 투자 회사)에서 분리된 AI 연구팀임. 돈 굴리다가 AI에 꽂혀서 회사 차린 케이스. 창업자는 저장대 출신 엔지니어 겸 투자자 량원평임.
중국 정부가 미국산 고성능 AI 칩(엔비디아 H100) 못 쓰게 제재당한 상황에서도 이 성과를 냈다는 게 더 대단한 포인트임. 제약이 오히려 효율 연구를 자극한 셈이라는 분석이 있음.
MoE 아키텍처 — 효율의 비밀
DeepSeek이 효율적인 이유 중 하나가 MoE(Mixture of Experts) 구조임. 문제에 따라 필요한 전문가만 활성화하는 방식인데, 수학 문제면 수학 전문가 AI만, 번역이면 언어 전문가 AI만 켜는 식임. 전체를 다 켜는 것보다 훨씬 효율적임.
엔비디아 주가 폭락
DeepSeek 발표 다음날, 미국 주식시장에서 엔비디아 주가가 17% 폭락함. "저비용 AI가 가능하다면 비싼 GPU(그래픽카드) 그렇게 많이 안 사도 되는 거 아냐?"라는 공포가 시장을 덮쳤기 때문임. 시가총액 830조 원어치가 하루에 사라진 거임. 역사상 단일 기업 하루 최대 손실 기록이었음.
문제점도 있음
텐안먼, 대만, 위구르 같은 중국에 민감한 주제는 답변 안 하거나 중국 정부 말만 함. 쓰면서 입력한 데이터가 중국 서버에 저장된다는 것도 프라이버시 이슈. 이탈리아는 아예 차단해버림. 미국에서도 정부 기관 사용 금지 논의가 있음.
결론
DeepSeek 덕분에 "AI = 돈 많이 써야 잘 만든다"는 공식이 흔들리기 시작했음. 이제 AI 경쟁은 더 효율적으로 만드는 싸움이 된 거임. 미국 AI 업계가 "우리도 더 효율적으로 만들어야 한다"고 방향을 바꾸는 계기가 됐음.
딥시크는 중국에서 만든 아주 똑똑한 AI 프로그램이에요. 미국에서 만든 ChatGPT처럼 질문에 답해주고, 글도 써주는 AI랍니다.
어떻게 유명해졌을까요?
2025년에 딥시크를 만든 사람들이 "우리 AI가 미국 AI만큼 잘하는데, 훨씬 적은 돈으로 만들었어요!"라고 발표했어요. 마치 다른 아이들이 비싼 장난감으로 만든 것과 똑같은 것을 저렴한 재료로 뚝딱 만든 것처럼요. 이 소식에 전 세계 사람들이 깜짝 놀랐답니다. 미국 주식 시장이 크게 흔들렸을 정도로 굉장한 일이었어요.
헤지펀드에서 시작된 회사
딥시크를 만든 회사는 원래 AI 회사가 아니었어요. 돈을 잘 굴리는 투자 회사였는데, AI 연구를 하다가 점점 AI에 빠져서 AI 회사로 방향을 바꿨어요. 마치 요리사가 되고 싶어서 식당을 차린 것처럼요.
특별한 점 — 코드를 공개했어요
딥시크는 AI를 만드는 방법(코드)을 무료로 공개했어요. 마치 맛있는 케이크 레시피를 전 세계에 공짜로 알려준 것처럼요. 그래서 전 세계 개발자들이 딥시크 기술을 가져다 자기만의 AI를 만들 수 있어요. 정말 멋지죠?
주의할 점
딥시크는 중국 회사가 만들었기 때문에, 중국에서 이야기하기 어려운 주제들은 잘 답변을 안 해요. 모든 AI가 완벽하지는 않답니다. 좋은 점도 있고 아쉬운 점도 있어요.
더 알아보기
왜 나라마다 AI를 따로 만들까요? AI는 각 나라의 언어와 문화를 반영하기 때문에, 각 나라가 자기 나라에 맞는 AI를 만들고 싶어한답니다. 앞으로 우리나라에서도 더 좋은 AI가 나오길 기대해봐요!
January 2025 marked a seismic shift in the global AI landscape when China's relatively unknown startup, DeepSeek (딥시크), emerged with a groundbreaking model, DeepSeek-R1, challenging established giants like OpenAI. This wasn't just about performance parity with OpenAI's latest generative model, o1; DeepSeek achieved comparable results at a fraction of the training cost, sending shockwaves through the industry. The revelation that training expenses barely reached $60 million fueled anxieties about China's rapid technological advancement and sparked fervent debate about the dawn of "affordable high-performance AI."
From Hedge Fund to AI Pioneer:
DeepSeek's origins trace back to High-Flyer (幻方科技), a hedge fund headquartered in China. While not initially focused on AI, High-Flyer established its own research team in 2021, culminating in DeepSeek's independent launch in 2023 under the leadership of Liang Wenpeng (梁文锋), a seasoned AI researcher and investor from Zhejiang University. Notably, DeepSeek adopted a research-centric approach from inception, prioritizing open-source contributions and academic publications over immediate commercial gains, rapidly gaining traction within the global AI community.
Efficiency Redefined with DeepSeek-V2:
DeepSeek's momentum accelerated with the unveiling of DeepSeek-V2 in May 2024. This model leveraged the Mixture of Experts (MoE) architecture, significantly reducing computational demands while maintaining impressive performance. By activating only necessary "experts" for specific tasks, DeepSeek-V2 achieved a 5x reduction in inference costs compared to predecessors like GPT-4, sparking a price war in China's AI market as competitors like Alibaba Qwen and Baidu ERNIE aggressively lowered their API prices.
DeepSeek-R1: A Paradigm Shift in Training:
DeepSeek-R1, launched in January 2025, transcended mere technological advancement; it signaled a revolutionary shift in AI training methodologies. Instead of relying heavily on supervised fine-tuning (SFT), DeepSeek-R1 demonstrated the efficacy of pure Reinforcement Learning (RL) for achieving human-level performance in tasks like mathematics, coding, and logical reasoning, matching OpenAI's o1 benchmark. While the reported training cost of $60 million raised eyebrows and skepticism regarding potential hidden expenses, the stark contrast with the billions poured into AI development by giants like OpenAI and Google undeniably highlighted a paradigm shift towards accessibility in AI creation.
Geopolitical Undercurrents: The Semiconductor Squeeze:
Understanding DeepSeek's emergence necessitates contextualizing the ongoing US-China semiconductor rivalry. Since 2022, stringent US export controls on advanced AI chips like Nvidia's A100 and H100 severely hampered China's access to cutting-edge hardware. This constraint, ironically, may have catalyzed DeepSeek's innovative approach, pushing them towards maximizing efficiency within resource limitations.
Open Source as Soft Power:
DeepSeek's decision to open-source its model weights under an MIT license marked a significant move. This strategy not only fostered global collaboration and validation but also strategically positioned Chinese AI as transparent and trustworthy compared to traditionally closed-source Western counterparts like GPT and Claude. This open approach aimed to bolster China's international standing in the AI domain.
Challenges and Concerns:
Despite its breakthroughs, DeepSeek faces valid criticisms. Its responses to sensitive geopolitical topics often reflect biases aligned with Chinese government perspectives, raising concerns about censorship and data privacy. The storage of user data on Chinese servers further fueled anxieties, prompting regulatory actions like Italy's temporary ban on DeepSeek and discussions within the US government regarding potential restrictions for certain sectors.
Looking Ahead: A New Era of AI Competition:
DeepSeek's disruptive entry has fundamentally altered the AI competitive landscape. By demonstrating that exceptional AI capabilities can be achieved with significantly reduced resources, it shattered the perception that immense capital and computational power are prerequisites for cutting-edge AI development. This shift towards prioritizing efficiency heralds a new era of competition, where China's advancements in AI technology are poised to intensify the global race for AI dominance.