인공지능 학습에 공공저작물 자유롭게 활용…’AI 유형’ 신설

핵심 요약

문화체육관광부와 과학기술정보통신부는 28일 제4회 과학기술관계장관회의에서 공공저작물의 인공지능(AI) 학습 활용을 확대하는 방안을 발표했다. 정부는 출처 표기 의무를 면제하는 ‘제0유형’을 도입하고, 기존 공공누리 유형과 별개로 AI 학습 전용 ‘AI유형’을 신설했다. 이번 조치는 공공기관 보유 자료의 대규모 처리와 AI 모델 학습에 활용될 공공데이터 범위를 넓히려는 목적이다. 향후 공공누리 표시 확대와 평가 반영, 저작권법 개정 등이 병행될 예정이다.

핵심 사실

  • 발표일과 주체: 2024년 1월 28일(제4회 과학기술관계장관회의) 문체부와 과기정통부가 공동 발표했다.
  • 새 유형 도입: 공공누리에 출처 표기 의무를 제거한 ‘제0유형’을 신설했다.
  • ‘AI유형’ 도입: 기존 공공누리의 이용제한이 있는 저작물도 AI 학습 목적에 한해 자유활용을 허용하는 ‘AI유형’을 신설했다.
  • 기존 데이터 현황: 과기정통부는 2017년부터 AI 허브에 903종의 학습용 데이터를 구축·개방해왔다.
  • 확산 전략: 정부는 수요가 많은 공공저작물부터 유형 전환을 우선 적용하고 공공기관 평가에 개방 노력을 반영하는 방안을 검토 중이다.
  • 지원·교육: 문체부는 공공기관 담당자 대상 방문 교육과 유형 전환 지원, 홍보를 추진한다.
  • 상담 창구: 공공저작물 이용 관련 문의는 한국문화정보원 상담창구를 통해 지원한다.
  • 법제 개선: 문체부는 공공누리 표시 의무화를 위한 저작권법 개정도 추진할 계획이다.

사건 배경

공공저작물은 중앙·지방정부 및 공공기관이 보유한 문서·이미지·통계자료 등으로, 방대한 양과 신뢰성을 바탕으로 인공지능 학습 데이터의 핵심 원천으로 평가된다. 그러나 기존 공공누리(공공저작물 이용허락 표시)는 유형별로 출처 표기나 변경·상업적 이용 제한을 두어 대량 데이터 처리와 학습 파이프라인에 적용할 때 실무적 혼선이 발생해 왔다. 특히 AI 산업 현장에서는 개별 저작물마다 출처를 표시해야 하는 점이 자동화 과정에서 제약으로 작용한다는 지적이 있었다. 이같은 현장 의견과 AI 산업의 성장 필요성을 반영해 정부는 공공누리 제도 자체를 정비해 활용성을 높이기로 했다.

국내외적으로는 공공데이터 개방 정책이 디지털 산업 경쟁력의 중요한 요소로 자리 잡고 있다. 우리 정부도 ‘국민 세금으로 생성된 데이터는 공공재’라는 원칙을 강조하며 개방을 확대해 왔고, 이번 조치는 그 연장선상에 있다. 다만 저작권과 개인정보·민감정보 보호, 데이터 품질 관리 등 규제·윤리적 문제는 병행 검토가 필요한 과제로 남아 있다. 정부는 이러한 균형을 맞추기 위해 제도적 보완과 기술적 보호조치 도입을 병행할 계획이라고 밝혔다.

주요 사건

문체부와 과기정통부는 28일 회의에서 공공누리 체계에 ‘제0유형’과 ‘AI유형’을 추가하는 개정안을 공개했다. 제0유형은 상업적 이용과 변경 이용을 허용하며 출처 표기 의무를 삭제해 대규모 정보 처리 및 자동화된 학습 파이프라인에서의 활용을 용이하게 했다. AI유형은 기존 공공누리의 이용 조건을 보존하면서도 AI 학습 목적에는 별도로 자유로운 활용을 허용하는 표시로, 원소유자의 권리를 일정 부분 보장하면서도 학습 활용을 가능하게 하는 절충안이다.

정부는 우선 민간 수요가 많은 공공저작물부터 두 유형의 표시 적용을 확대할 방침이다. 각 부처와 공공기관의 공공누리 표시 현황을 점검한 뒤 한국문화정보원과 함께 데이터 가공·전환 사업을 추진해 AI 학습에 ‘즉시’ 활용 가능한 형태로 가공한 데이터를 개방할 계획이다. 또한 공공저작물 개방 노력을 공공기관 평가에 반영하는 인센티브도 검토 중이며, 유형 전환을 위한 담당자 교육과 현장 지원을 병행한다.

과기정통부는 기존 AI 허브(2017년 이후 구축된 903종 데이터)를 인공지능 학습용 데이터 통합제공체계로 고도화하고, 공공·민간 보유 데이터 중 가치 있는 자원을 선별해 학습용으로 전환·개방하겠다고 밝혔다. 문체부는 저작권법의 관련 규정을 정비해 공공누리 표시 의무화를 추진할 계획이며, 한국문화정보원은 데이터 가공 및 상담‧지원 창구 운영을 맡는다.

분석 및 의미

첫째, 이번 조치는 국내 AI 연구·산업 생태계에 즉각적인 긍정적 영향을 줄 가능성이 크다. 출처 표기와 이용 제한이 완화되면 데이터 수집·정제 비용과 법적 검토 부담이 줄어들어 중소기업과 스타트업이 공공데이터를 보다 적극적으로 활용할 수 있다. 다만 데이터의 품질 관리와 저작권 귀속 문제는 계속 검토해야 한다. 데이터 가공 과정에서 원본의 저작권 귀속과 2차적 저작물 문제가 새롭게 부각될 수 있기 때문이다.

둘째, 법적·윤리적 측면에서 균형이 요구된다. ‘제0유형’은 출처 표기 의무를 제거해 활용 편의성을 높였지만, 저작자의 명예나 원저작물의 맥락이 훼손될 위험을 완전히 배제할 수 없다. 따라서 정부의 제도 개선은 개인정보 비식별화, 민감정보 필터링, 저작권자 보호 장치 등을 기술적·행정적으로 보완하는 정책과 병행돼야 한다. 또한 AI 학습용 데이터로의 전환 과정에서 투명한 라벨링과 메타데이터 제공이 필수적이다.

셋째, 국제적 파급력과 협력의 관점에서 볼 때 공공데이터 개방은 경쟁력 요소로 작용한다. 국가 차원의 데이터 개방이 가속화되면 글로벌 AI 연구 협업에서 한국 데이터가 중요한 자원으로 활용될 수 있다. 반면 국제 규범·저작권 체계의 차이로 인해 데이터의 교차·재사용 과정에서 법적 쟁점이 발생할 가능성도 존재한다. 따라서 해외 활용 가능성에 대한 법적 대비와 국제 협력 체계 구축이 병행돼야 한다.

비교 및 데이터

공공누리 유형 상업적 이용 변경(2차적 이용) 출처 표기 AI 학습 활용
제0유형 허용 허용 면제 자유활용
AI유형 기존 유형에 따름 기존 유형에 따름 기존 유형에 따름 학습 목적 자유활용
기존 1~4유형 유형별 상이 유형별 상이 대부분 의무 제한적(표시 필요)

위 표는 새로 도입된 제0유형과 AI유형이 기존 1~4유형과 비교해 어떤 이용범위를 가지는지 한눈에 보여준다. 특히 제0유형은 출처 표기를 면제해 자동화 파이프라인에서의 속도·비용 이점을 제공한다. AI유형은 원소유자의 기존 권리를 침해하지 않으면서도 학습 활용을 허용하는 중간 형태로 설계됐다. 이 표는 정책의 핵심 변화를 빠르게 이해하는 보조 자료로 활용할 수 있다.

반응 및 인용

정부 발표 직후 관련 분야 인사들과 업계에서는 환영의 목소리와 우려의 목소리가 동시에 나왔다. 문체부와 과기정통부는 제도 개선의 필요성과 함께 보완 조치도 병행하겠다고 밝혔다.

“공공저작물은 인공지능 산업을 이끌 수 있는 핵심 자원이다. 관련 제도를 정비하고 지원해 활용을 촉진하겠다.”

최휘영 문체부 장관

최 장관의 발언은 공공데이터를 AI 생태계의 적극적 자원으로 규정하고, 제도적 지원을 통해 활용을 늘리겠다는 정부 의지를 요약한다.

“국민 세금이 투입된 데이터는 최대한 개방한다는 원칙 아래 데이터가 막힘없이 흐르는 생태계를 조성하겠다.”

배경훈 부총리 겸 과기정통부 장관

배 부총리의 발언은 공공데이터 개방이 국민적 자산이라는 점을 강조하며, 향후 평가·인센티브를 통해 공공기관의 참여를 독려하겠다는 정책적 방향을 제시한다.

“출처 표기 의무 완화는 활용성을 높이지만, 데이터 품질·윤리 문제에 대한 보완책이 필요하다.”

AI 데이터 전문가(익명)

전문가의 반응은 정책의 실효성을 높이기 위해 기술적·윤리적 보완이 필수임을 환기한다. 업계는 구체적 전환 일정과 가공된 데이터의 접근 방식 등에 대한 추가 안내를 요구하고 있다.

불확실한 부분

  • 어떤 공공저작물이 우선적으로 제0유형 또는 AI유형으로 전환될지 구체적 목록은 아직 공개되지 않았다.
  • 저작권자(개인 또는 단체)의 이의 제기 시 처리 절차와 보상 방식 등 세부 운영 규칙은 확정되지 않았다.
  • 가공된 데이터의 해외 제공·재사용 시 발생할 수 있는 국제법적 쟁점과 대응 방안은 추가 검토가 필요하다.

총평

이번 공공누리 개정은 공공저작물을 AI 학습에 보다 적극적으로 활용하기 위한 실무적 장치라는 점에서 의미가 크다. 제0유형과 AI유형의 도입으로 데이터 확보 비용과 법적 불확실성이 줄어들어 연구·산업계의 활용도가 높아질 가능성이 있다. 그러나 출처 표기 면제와 같은 조치는 저작자 권리·명예 보호, 데이터의 맥락 훼손 등의 부작용을 낳을 수 있으므로 보완 장치가 병행되어야 한다.

정책의 효과는 유형 전환의 속도, 가공된 데이터의 품질관리, 그리고 저작권·개인정보 관련 보완 조치의 충실성에 달려 있다. 정부는 향후 공공기관 평가 반영과 저작권법 개정, 기술적 보호조치 도입을 통해 균형을 맞춰 나가야 한다. 독자는 향후 공개될 세부 실행계획과 가공 데이터 품목을 주시할 필요가 있다.

출처

댓글 남기기