5분 읽기
- GEMA(독일 음악 저작권 단체)가 AI 기업 OpenAI를 상대로 제기한 소송
- 뮌헨 지방 법원, GEMA 승소 판결
- AI 기업이 저작권이 있는 자료를 허가 없이 학습 데이터로 어느 정도까지 사용가능한가
- "인터넷은 셀프서비스 상점이 아니다“
저작권: GEMA, OpenAI에 승소
인공지능과 저작권을 둘러싼 논쟁적인 쟁점은 무엇일까?
저작권 분쟁:
생성 AI 모델을 저작권이 있는 음악, 이미지, 텍스트로 학습시킬 수 있을까? 그리고 이러한 인공지능의 결과물은 저작권을 침해하지 않으면서 얼마나 유사할 수 있을까? 이는 GEMA가 AI 기업 OpenAI를 상대로 제기한 소송의 주제였다. 뮌헨 지방 법원은 GEMA의 손을 들어주었다. 하지만 그 결과는 무엇일까? 그리고 이 소송과 유사한 소송의 핵심 쟁점은?
 |
| ▲ 음악 저작권 단체 GEMA는 뮌헨 지방 법원에 [불분명]을 상대로 소송을 제기했다. |
ChatGPT, Gemini 등과 같은 인공지능은 놀라울 정도로 뛰어난 품질의 텍스트, 이미지, 비디오, 음악 트랙을 생성할 수 있다. 하지만 이러한 결과물이 AI 시스템이 진정으로 독창적으로 만들어낸 것일까? 이러한 인공지능의 학습은 인간이 제작한 수백만 개의 텍스트, 이미지, 음악 트랙, 그리고 수많은 저작권이 있는 작품을 기반으로 한다.
하지만 바로 여기서 법적 문제가 시작된다. AI 기업을 상대로 이미 저작권 침해 소송이 여러 건 제기되었다. 원고에는 뉴욕 타임스와 같은 출판사 및 언론사, 아티스트, 음악 프로듀서, 그리고 게티 이미지와 같은 대형 이미지 데이터베이스가 포함된다.
쟁점은 무엇일까?논란의 여지가 있는 쟁점 중 하나는 OpenAI, Google 등과 같은 AI 기업이 저작권이 있는 자료를 허가 없이 학습 데이터로 사용할 수 있는지, 그리고 어느 정도까지 사용할 수 있는지다. 현재 이러한 데이터의 사용은 텍스트 마이닝이나 데이터 마이닝에만 허용되다. 이 맥락에서 데이터는 통계 분석, 예를 들어 포괄적인 추세나 상관관계를 조사하는 용도로만 사용된다. 원본 데이터의 내용은 게시되거나 복제되지 않는다.
두 번째 쟁점은 AI 모델의 출력이다. GPT, Sora, Gemini 등의 제품에 저작권이 있는 학습 자료가 얼마나 남아 있을까? 그들의 출력 중 일부는 표절에 불과하거나, 심지어 부분적으로는 이전에 "학습된" 저작물을 그대로 복사한 것일까? ChatGPT 초창기에도 연구 결과 텍스트에 저작권이 있는 저작물의 전체 구절이 포함되어 있는 것으로 밝혀졌다. 이러한 원문 그대로의 사본은 평균 483자였다. 이미지와 음악에서도 표절이 흔했다.
그러나 여전히 의문은 남는다. 유사성이 어느 정도까지 저작권 침해에 해당할 만큼 중요해지는 걸까? 예를 들어, 비디오, 이미지 또는 음악 작품이 특정 아티스트의 스타일을 어느 정도까지 모방할 수 있을까? 예를 들어 2025년 봄, OpenAI는 ChatGPT에 여러 편의 세계적으로 성공한 애니메이션 영화를 제작한 일본 애니메이션 스튜디오인 스튜디오 지브리(Ghibli) 스타일의 이미지를 생성할 수 있는 권한을 부여했다는 이유로 비난을 받았다.
GEMA가 OpenAI를 상대로 제기한 소송은 무엇이었을까?최근 뮌헨 지방 법원은 음악 분야의 저작권 문제에 대한 판결을 내렸다. 이 사건에서 독일 음악 저작권 단체인 GEMA는 OpenAI를 고소했다. 고소 내용은 다음과 같다. OpenAI는 저작권이 있는 노래 가사로 AI 모델을 훈련시켰고, 모델은 이를 저장한 후 사용자 요청에 따라 원문 그대로 복제하기도 했다. 헬레네 피셔(Helene Fischer)의 "Atemlos", 헤르베르트 그뢰네마이어(Herbert Grönemeyer)의 "Männer", 라인하르트 마이(Reinhard Mey)의 "Über den Wolken"을 포함한 9곡의 독일어 노래가 영향을 받았다.
GEMA에 따르면, 이러한 가사를 그대로 복제하는 것은 지적 재산권의 무단 복제에 해당하며, 따라서 저작권법 위반에 해당한다. 작사가와 작곡가는 라이선스가 있는 출판물과 달리 이러한 복제에 대해 어떠한 대가도 받지 않기 때문이다.
반면, OpenAI는 저작권이 있는 가사의 사용은 데이터 마이닝의 범주에 속하므로 저작권의 적용을 받지 않는다고 주장한다. 또한, 이 AI 모델은 데이터베이스처럼 가사를 그대로 저장하지 않는다. 특정 학습 데이터를 저장하거나 복사하는 것이 아니라, 전체 학습 데이터셋을 기반으로 학습한 내용을 매개변수에 반영한다. 또한, OpenAI는 챗봇에 이러한 가사 출력을 요청한 개별 사용자에게 책임이 있으며, OpenAI는 책임을 지지 않는다고 주장한다.
GEMA 승소 판결법원은 GEMA의 손을 들어주었다. 판사들은 저작권이 있는 가사의 문자 그대로의 출력 결과는 AI 모델이 단순히 동일한 형태로 무작위로 생성한 것이 아니라, 해당 가사를 저장했음을 증명한다고 주장했다. 따라서 이는 데이터 마이닝의 예외에 해당하지 않는다. 따라서 라이선스 없이 가사를 사용하는 것은 저작권 이용권을 침해하는 것이다.
"제 생각에 뮌헨 법원의 판결은 옳았다"고 유럽 비아드리나 프랑크푸르트 대학교(오데르)의 디지털법 및 윤리학과 필립 해커(Philipp Hacker) 교수는 말했다. "AI 모델에는 간단한 프롬프트를 사용하여 작품을 재구성할 수 있는 정보가 포함되어 있다. 하드 드라이브에 저장된 작품이라 하더라도 인코딩된 정보로 구성되어 있으며, 그 복제는 기술적 과정을 통해서만 가능하다. 그럼에도 불구하고 이는 복제에 해당한다.“
"인터넷은 셀프서비스 상점이 아니다.“지방법원은 또 다른 측면에서도 GEMA의 손을 들어주었다. 사용자가 아닌 AI 기업이 생성 AI 모델의 결과에 대한 책임을 져야 한다. 기업은 필요한 경우 적절한 필터를 통해 자사의 인공지능이 저작권이 있는 콘텐츠를 생성하지 않도록 해야 한다. 최근 영국 법원은 이미지 제공업체 게티 이미지가 이미지 생성업체 스태빌리티 AI를 상대로 제기한 소송에서 유사한 판결을 내렸다.
GEMA CEO 토비아스 홀츠뮐러(Tobias Holzmüller)는 이번 판결에 대해 만족감을 표하며 다음과 같이 말했다. "인터넷은 셀프서비스 상점이 아니며, 인간의 창작물도 무료 템플릿이 아니다. 오늘 우리는 저작권자의 권리를 보호하고 명확히 하는 선례를 만들었다. ChatGPT와 같은 AI 도구 운영자 또한 저작권법을 준수해야 한다."
분쟁의 종식은 아니다.그러나 OpenAI는 뮌헨 지방 법원의 판결에 항소할 수 있으며, 이 판결은 처음에는 특정 독일어 노래 가사에만 적용되며 국내에서 유효하다. 튀빙겐 대학교의 AI 법 전문가 미셸 핑크(Michèle Finck)는 "이번 판결은 법적 확실성을 높이기 위한 조치이지만, 항소 절차는 아직 끝나지 않았다"고 강조했다. "이 핵심 문제에 대한 EU 차원의 조화로운 해결책은 아직 계류 중이다.“
인공지능, 특히 생성 AI는 국경과 무관하게 작동하기 때문에 많은 전문가는 이러한 문제를 비롯한 저작권 문제 또한 국제 차원에서 해결되어야 한다고 생각한다. 예를 들어, 저작권이 있는 데이터 사용에 대한 라이선스를 부여하거나, GEMA와 유사한 집단 보상 모델을 개발하여 예술가들이 자신의 작품 사용에 대한 보상을 받을 수 있다. 이는 AI를 활용하더라도 마찬가지다.
출처:
Landgericht München, GEMA, Science Media Center Germany
뮌헨 지방 법원, GEMA, 독일 과학 미디어 센터
[더사이언스플러스=문광주 기자]
[저작권자ⓒ the SCIENCE plus. 무단전재-재배포 금지]