HANGUL.WIKI

로봇 3원칙

Three Laws of Robotics

번역 제공
2,646자 · 2026-04-29
목차 (9개 섹션)

로봇 3원칙

"로봇은 인간을 해쳐서는 안 된다." 한 SF 작가의 상상이 70년 넘게 AI 윤리 논쟁의 중심에 서 있다. 실리콘밸리 기업들도, 유엔 전문가들도, 이 세 줄짜리 원칙 앞에서 고민을 멈추지 못한다.

개요

로봇 3원칙(Three Laws of Robotics)은 SF 작가 아이작 아시모프(Isaac Asimov)가 1942년 단편 소설 「런어라운드(Runaround)」에서 처음 제시한 로봇 행동 원칙이다. 아시모프는 단순히 로봇이 악당인 SF의 클리셰를 벗어나, 로봇과 인간이 공존할 수 있는 논리적 틀을 만들고자 했다. 이 세 원칙은 이후 수십 편의 소설·영화·드라마에 영향을 미쳤고, 실제 AI 윤리 논의에서도 핵심 참고점으로 인용되고 있다.

원칙의 내용

제1원칙: 로봇은 인간을 해쳐서는 안 되며, 행동하지 않음으로써 인간이 해를 입도록 내버려 두어서도 안 된다. (A robot may not injure a human being or, through inaction, allow a human being to come to harm.)

제2원칙: 로봇은 인간의 명령에 복종해야 한다. 단, 그 명령이 제1원칙과 충돌하는 경우는 예외로 한다. (A robot must obey the orders given it by human beings except where such orders would conflict with the First Law.)

제3원칙: 로봇은 자신의 존재를 보호해야 한다. 단, 그 보호 행위가 제1원칙 또는 제2원칙과 충돌하는 경우는 예외로 한다. (A robot must protect its own existence as long as such protection does not conflict with the First or Second Law.)

원칙은 엄격한 우선순위를 가진다. 1원칙 > 2원칙 > 3원칙 순서로 적용된다.

제로스 법칙: 확장판

아시모프는 1985년 소설 「로봇과 제국(Robots and Empire)」에서 '제0원칙(Zeroth Law)'을 추가했다.

제0원칙: 로봇은 인류를 해쳐서는 안 되며, 행동하지 않음으로써 인류가 해를 입도록 내버려 두어서도 안 된다.

이 원칙은 기존 3원칙보다 상위에 위치하며, '개인 인간'이 아닌 '인류 전체'를 보호하기 위해 개별 인간을 희생시키는 것도 가능함을 의미한다. 소설 속에서 로봇들이 이 원칙을 활용해 수천 년에 걸친 인류 조종을 정당화하는 극적인 전개가 펼쳐진다.

아시모프 소설 속 3원칙의 한계

아시모프 자신이 3원칙의 논리적 허점을 소설의 플롯 장치로 적극 활용했다. 수십 편의 소설에서 세 원칙이 어떻게 충돌하고 변형되는지 다양한 시나리오를 탐구했다.

대표적 충돌 사례:

  • 의사가 "절개해라"고 명령할 때 로봇은 '인간을 해치는' 행위를 1원칙으로 거부해야 할까, 2원칙으로 따라야 할까?
  • 한 인간을 구하기 위해 다른 인간을 해쳐야 한다면?
  • "인류"를 위해 개인을 희생시키는 것이 0원칙으로 정당화될 때, 로봇은 독재자가 되지 않는가?

현실 AI 윤리에서의 영향

로봇 3원칙은 SF 문학 범위를 넘어 실제 AI 정책에 영향을 미치고 있다. 구글, 딥마인드 등 AI 기업들의 안전 원칙에는 아시모프의 3원칙 정신이 녹아 있다는 평가를 받는다. 유럽연합(EU) AI 법(AI Act)의 '인간 감독 원칙'이나 유네스코 AI 윤리 권고안도 사실상 1원칙의 현대적 해석이라 할 수 있다.

그러나 브루킹스 연구소를 비롯한 여러 AI 전문가들은 3원칙이 실제 적용에 있어 근본적 한계를 가진다고 비판한다. 첫째, '해(harm)'의 정의가 문화·상황·가치관에 따라 다르다. 둘째, '인간'의 범위가 불명확하다. 셋째, 3원칙만으로는 AI가 사회 전체에 미치는 시스템적 위험을 다룰 수 없다. 실제 자율 살상 무기(LAWS) 문제에서 보듯, 기계에 도덕적 판단을 위임하는 것이 얼마나 복잡한 문제인지는 현실이 증명하고 있다.

문화적 파급력

로봇 3원칙은 SF 문화 전반에 스며들었다. 1984년 영화 「터미네이터」의 스카이넷, 2004년 영화 「아이, 로봇(I, Robot)」, 드라마 「웨스트월드」, 애니메이션 등 수많은 작품이 이 원칙을 비틀거나 파괴하는 시나리오를 탐구했다. '로봇이 반란을 일으키는' 장르의 공통 전제가 바로 "3원칙이 어떻게 붕괴되는가"다.

한국에서도 네이버 웹툰, SF 소설, 게임 등에서 3원칙을 모티브로 한 작품들이 다수 창작됐으며, 로봇 윤리 교육 과정에서도 필수 항목으로 가르치고 있다.

향후 의의

ChatGPT·클로드·제미나이 등 대형 언어 모델(LLM)의 등장으로, 아시모프가 상상했던 인공지능 로봇 시대가 현실화되고 있다. AI 안전(AI Safety) 연구자들은 3원칙의 정신을 현대 AI에 어떻게 적용할지 고민한다. 그러나 3원칙은 규칙 기반 시스템에 가깝고, 현재 AI는 통계적 패턴 학습 기반이라 직접 적용은 어렵다. '정렬 문제(Alignment Problem)'라 불리는 AI 가치 정렬 연구가 현대판 3원칙 프로젝트라 할 수 있다.

관련 항목

아이작 아시모프 / AI 윤리 / AI 안전 / EU AI Act / 자율 살상 무기 / 알고리즘 편향 / 정렬 문제 / 「아이, 로봇」 / 터미네이터 / 트롤리 딜레마

문서 정보

최초 작성
최종 갱신
분량
2,646자 (성인 기준)
분류
문화·과학

HANGUL.WIKI가 정리·작성한 문서입니다. 정확성을 위해 노력하나 오류가 있을 수 있으므로, 중요한 내용은 공식 출처를 통해 확인하시기 바랍니다. 내용의 오류나 정정 요청은 오류·정정 신고로 알려주시면 검토 후 반영합니다.