인공지능(AI)이 사이버 공격의 도구이자 표적이 되는 시대가 본격화됐다. AI 보안 위협이란 AI 기술을 악용한 공격 행위, AI 시스템 자체를 겨냥한 공격, 그리고 AI 도입으로 인해 새롭게 발생하는 취약점을 포괄하는 개념이다. 2024년 글로벌 사이버보안 기업 크라우드스트라이크(CrowdStrike)의 보고서에 따르면, AI를 활용한 사이버 공격 시도는 전년 대비 73% 증가했으며, 피싱·딥페이크·자동화 취약점 탐색 등이 주요 수법으로 부상했다.
AI를 이용한 공격 유형
AI 강화 피싱(Spear Phishing): 대형 언어 모델(LLM)을 활용해 개인화된 사회공학 공격 메시지를 대량 생성한다. 기존 피싱 이메일과 달리 문법적 오류가 없고, 피해자의 개인정보·직업·관심사를 반영한 정교한 내용을 자동 생성해 탐지가 매우 어렵다. 2023년 미국 재무부 직원을 타깃으로 한 AI 피싱 공격에서 ChatGPT 유사 모델이 활용된 사례가 보고됐다.
딥페이크(Deepfake) 기반 사기: 음성·영상 딥페이크를 이용한 CEO 사기(BEC·Business Email Compromise) 사건이 급증하고 있다. 2024년 홍콩에서 딥페이크 화상 회의를 통해 직원을 속여 약 2500만 달러(약 330억 원)를 이체시킨 사건이 발생했다.
자동화 취약점 탐색: AI가 소프트웨어 코드를 자동 분석해 보안 취약점(CVE·Common Vulnerabilities and Exposures)을 발견하고 익스플로잇 코드를 생성하는 능력은 기존 수작업 대비 공격 속도를 수십 배 높인다. 2024년 Google DeepMind 연구팀은 AI가 1시간 내에 CVE 취약점의 실용적 익스플로잇 코드를 생성할 수 있음을 시연했다.
악성 AI 모델(Poisoning Attack): 훈련 데이터에 악성 샘플을 주입해 AI 모델의 판단을 왜곡하는 데이터 포이즈닝 공격이다. 예를 들어 자율주행차의 객체 인식 모델에 특정 스티커가 붙은 정지 표지판을 무시하도록 학습시키는 등의 공격이 연구 수준에서 실증됐다.
AI 시스템을 겨냥한 공격
적대적 예제(Adversarial Example): 인간의 눈에는 정상으로 보이지만 AI에게는 오분류를 유발하는 입력값을 생성하는 공격이다. 이미지 분류, 얼굴 인식, 의료 진단 AI 등 다양한 분야에서 적대적 공격의 취약성이 확인됐다.
프롬프트 인젝션(Prompt Injection): LLM 기반 서비스에 악성 프롬프트를 삽입해 시스템 지시를 우회하거나 기밀 정보를 유출시키는 공격이다. 2023년 주요 AI 챗봇 서비스에서 반복적으로 발견됐으며, OWASP(오픈 웹 애플리케이션 보안 프로젝트)는 LLM 애플리케이션 보안 취약점 Top 10 중 1위로 프롬프트 인젝션을 선정했다.
모델 추출(Model Extraction): 공개 API를 통해 AI 모델에 대량의 쿼리를 보내 모델의 기능과 가중치를 역공학적으로 복제하는 공격이다. 기업의 독자 AI 모델이나 의료·금융 분야 전문 AI가 주요 표적이 된다.
국가 차원의 AI 사이버 공격
국가 지원 해킹 조직들의 AI 활용도 심화되고 있다. 마이크로소프트와 OpenAI가 2024년 2월 공개한 보고서에 따르면, 러시아(APT28·Fancy Bear), 북한(Lazarus), 중국(Volt Typhoon), 이란 등 국가 지원 해킹 그룹들이 ChatGPT 등 LLM을 사이버 공격 준비에 활용한 것으로 확인됐다. 주요 활용 사례는 피싱 메일 작성, 취약점 분석, 코드 디버깅, 표적 국가 언어 번역 등이다.
방어 기술과 AI 보안 체계
AI 보안 위협에 대응하는 주요 기술로는 AI 기반 이상 탐지(UEBA·User and Entity Behavior Analytics), 적대적 예제 방어(Adversarial Training), 모델 감사·해석 가능성(Explainable AI), 공급망 보안, 레드팀 AI 테스트 등이 있다. 2023년 미국 NIST는 'AI Risk Management Framework(AI RMF)'를 발표해 AI 시스템의 위험 관리 표준 체계를 제시했다. EU의 AI 법(EU AI Act)도 고위험 AI 시스템에 대한 보안 요건을 명시하고 있다.
주요 논란과 쟁점
AI 보안 분야의 핵심 쟁점은 공격·방어 기술의 비대칭성이다. AI를 활용한 공격은 비용이 낮고 자동화 수준이 높아 소규모 해커 집단도 정교한 공격을 수행할 수 있게 됐다. 반면 방어 측은 여전히 높은 비용과 전문 인력 부족에 시달린다. LLM 기업들의 안전장치(Guardrail) 우회 방법이 지속적으로 공개되는 것도 문제다. 또한 AI 취약점 공개(Responsible Disclosure) 정책의 표준화 필요성도 논의되고 있다.
전망
2025년 이후 생성형 AI의 확산과 함께 AI 보안 위협은 더욱 고도화될 전망이다. 자율 에이전트(Agentic AI)의 등장으로 인간의 개입 없이 스스로 공격을 기획·실행하는 AI 공격자의 등장도 가시화되고 있다. AI 보안 시장은 2030년까지 600억 달러 이상으로 성장할 것으로 예측된다. 국가 간 AI 안보 경쟁이 심화되면서, AI 사이버 공격에 대한 국제 규범 수립이 중요한 외교·안보 의제로 부상하고 있다.
AI 보안 위협
AI가 해킹에 쓰인다고?
맞아. 요즘 해커들이 AI를 이용해 더 정교한 공격을 펼치고 있어. 2024년 통계에 따르면 AI를 활용한 사이버 공격 시도가 전년보다 73%나 늘었어.
주요 AI 공격 방법
AI 피싱 메일
ChatGPT 같은 AI로 개인화된 사기 이메일을 대량으로 만들어. 예전 사기 메일은 문법 오류가 많아서 티가 났는데, AI가 작성하면 완벽한 문장으로 쓰여서 구별하기 어려워.
딥페이크 사기
가짜 목소리와 영상으로 사람을 속이는 딥페이크. 2024년 홍콩에서 직원이 딥페이크 화상회의에 속아 330억 원을 이체한 사건이 실제로 있었어.
자동 해킹 도구
AI가 프로그램 코드를 분석해서 취약점을 자동으로 찾고, 공격 코드까지 만들어낼 수 있어. 이전에는 전문 해커가 수일씩 걸리던 작업을 AI는 1시간 만에 할 수 있어.
AI 자체 공격
AI 시스템에 가짜 데이터를 먹여 판단을 틀리게 만들거나, AI 챗봇에 특수 명령을 넣어 비밀 정보를 빼내는 공격도 있어.
국가들도 AI 해킹을 해?
마이크로소프트가 2024년 보고서를 냈는데, 러시아, 북한, 중국, 이란의 국가 해킹 그룹들이 ChatGPT를 공격 준비에 사용한 게 확인됐어.
어떻게 방어해?
AI로 이상한 행동을 탐지하는 시스템
AI 모델 자체를 강화하는 훈련
국제적 AI 보안 규범 수립 (미국 NIST, EU AI 법 등)
AI 공격이 빠르게 진화하는 만큼, 보안 기술도 계속 발전해야 해. 우리도 의심스러운 링크 클릭 금지, 강력한 비밀번호 사용 같은 기본 보안 수칙을 지키는 게 중요해!
AI 보안 위협이란?
컴퓨터를 지켜야 해요
우리가 컴퓨터나 스마트폰을 쓸 때, 나쁜 사람들이 몰래 우리 정보를 훔치려 할 수 있어요. 이걸 '해킹'이라고 해요.
AI가 나쁜 곳에도 쓰여요
AI는 아주 똑똑하기 때문에, 나쁜 사람들이 해킹에 이용하기도 해요.
예를 들어:
AI로 아주 그럴듯한 사기 편지를 만들어요
AI로 가짜 영상이나 목소리를 만들어 사람들을 속여요
AI로 컴퓨터 프로그램의 약한 곳을 찾아서 공격해요
어떻게 지켜요?
모르는 링크는 클릭하지 않아요
비밀번호를 복잡하게 만들어요
의심스러운 이메일은 열지 않아요
좋은 곳에서도 AI로 이런 나쁜 공격을 막는 방어 프로그램을 만들고 있어요. AI를 좋은 용도로 사용하는 것이 중요해요!
AI Security Threats
Overview
The era has dawned where artificial intelligence (AI) serves both as a tool and target for cyber attacks. AI security threats encompass malicious attacks leveraging AI technology, attacks targeting AI systems themselves, and new vulnerabilities arising from AI integration. According to a 2024 report by global cybersecurity firm CrowdStrike, attempts at AI-driven cyber attacks surged by 73% year-over-year, with phishing, deepfakes, and automated vulnerability scanning emerging as primary tactics.
Types of AI-Based Attacks
AI-Enhanced Spear Phishing: Utilizing large language models (LLMs), attackers generate highly personalized social engineering messages at scale, surpassing traditional phishing emails in sophistication due to error-free grammar and tailored content reflecting victims' personal details, careers, and interests, making detection exceedingly difficult. An instance involved AI phishing attacks targeting U.S. Treasury Department employees in 2023, reportedly employing models akin to ChatGPT.
Deepfake Fraud: There has been a significant increase in CEO fraud (Business Email Compromise) leveraging voice and video deepfakes. Notably, in 2024, a Hong Kong incident saw attackers deceive employees via deepfake video calls, resulting in the transfer of approximately $250 million (about 330 billion KRW).
Automated Vulnerability Scanning: AI's capability to automatically analyze software code, identify security vulnerabilities (CVEs), and generate exploit codes dramatically accelerates attack speeds compared to manual methods. Google DeepMind demonstrated in 2024 that AI could generate practical exploit codes for CVEs within an hour.
Malicious AI Model Poisoning: This involves injecting malicious samples into training data to distort AI models' decision-making processes through data poisoning attacks. For example, research has shown attacks where autonomous vehicles' object recognition models are trained to ignore stop signs with specific stickers.
Attacks Targeting AI Systems
Adversarial Examples: These involve crafting inputs that appear normal to humans but mislead AI systems, affecting areas like image classification, facial recognition, and medical diagnostics. Vulnerabilities in these sectors have been identified through adversarial attacks.
Prompt Injection: Malicious prompts are inserted into Large Language Model (LLM) services to bypass system instructions or leak confidential information. This tactic was frequently observed in major AI chatbot services in 2023, ranking as the top security vulnerability by OWASP (Open Web Application Security Project) in their LLM application security list.
Model Extraction: Through mass queries sent via public APIs, attackers reverse-engineer AI models to replicate their functionalities and weights, primarily targeting proprietary AI models in enterprises and specialized AI systems in sectors like healthcare and finance.
State-Sponsored AI Cyber Attacks
The utilization of AI by state-sponsored hacking groups is intensifying. According to a February 2024 report by Microsoft and OpenAI, state hacking entities such as APT28 (Fancy Bear) from Russia, Lazarus from North Korea, Volt Typhoon from China, and Iran have integrated LLMs like ChatGPT into their cyber attack strategies, employing these models for tasks like crafting phishing emails, vulnerability analysis, code debugging, and translating into target languages.
Defense Technologies and AI Security Frameworks
Key technologies combating AI security threats include AI-driven anomaly detection (UEBA), adversarial training, explainable AI (XAI) for model auditing, supply chain security, and red team AI testing. In 2023, NIST released the 'AI Risk Management Framework (AI RMF)' outlining standards for managing AI system risks. Similarly, the EU AI Act specifies security requirements for high-risk AI systems.
Key Debates and Challenges
A central issue in AI security is the asymmetry between offensive and defensive capabilities. While AI attacks are cost-effective and highly automated, enabling even small groups to execute sophisticated attacks, defense mechanisms still face high costs and a shortage of specialized personnel. Continuous revelations of methods to bypass safeguards in LLM systems exacerbate these challenges. Additionally, there is a pressing need for standardized responsible disclosure policies regarding AI vulnerabilities.
Future Outlook
As generative AI becomes more prevalent post-2025, AI security threats are expected to evolve further. The emergence of autonomous agent AI could lead to attacks planned and executed without human intervention. The AI security market is projected to exceed $60 billion by 2030, intensifying international competition over AI security norms, making the establishment of global regulatory frameworks a critical diplomatic and security priority.
English version not yet available.
English version not yet available.
문서 정보
최초 작성
최종 갱신
분량
2,619자 (성인 기준)
분류
기술·보안
HANGUL.WIKI가 정리·작성한 문서입니다. 정확성을 위해 노력하나 오류가 있을 수 있으므로,
중요한 내용은 공식 출처를 통해 확인하시기 바랍니다.
내용의 오류나 정정 요청은 오류·정정 신고로 알려주시면 검토 후 반영합니다.