본문 바로가기

LIFE

위키백과, AI 기업들에게 “공짜 스크래핑은 이제 그만”

2025년 11월, 위키백과가 드디어 AI 시대의 현실을 인정하고 목소리를 냈어...
핵심 메시지는 단순하지만 묵직하네

“AI 개발자들이여, 이제 공짜로 긁지 말고, 유료 API를 써라.”

 

그동안 AI 모델들이 위키백과 데이터를 거의 ‘기본 교재’처럼 사용해왔다는 걸 생각하면,
이건 단순한 항의가 아니라 지식 생태계의 방향을 재조정하자는 선언에 가깝지?

[이미지출처: ChatGPT 생성]

 

왜 위키백과가 이런 말을 했을까?

위키백과를 운영하는 위키미디어 재단(Wikimedia Foundation)은 공식 블로그에서 AI 기업과 개발자들에게 “책임감 있는 데이터 사용”을 촉구했어. 그 말은 곧, “이제 무단 스크래핑 하지 말고, 우리가 제공하는 Wikimedia Enterprise API를 써라”는 것.

이 API는 대규모 기업이 위키 데이터를 안정적으로 이용할 수 있게 만든 공식 유료 서비스야. 단순히 돈을 벌기 위함이 아니라,
AI 트래픽이 위키 서버에 과부하를 주는 문제를 해결하면서 공정한 데이터 사용 구조를 만들겠다는 취지야.

이걸 두고 보면, 위키백과도 단순한 “열린 지식 플랫폼”을 넘어 “지속 가능한 오픈 생태계”로 전환하려는 움직임을 보이는 거지.

 

[이미지출처: https://enterprise.wikimedia.com/api/ 캡쳐]

 

AI가 위키백과에 남긴 그림자

AI 덕분에 위키백과의 콘텐츠는 더 많이 인용되고 있어. 하지만 문제는, 사람들이 직접 사이트를 방문하지 않는다는 거야.

위키미디어 재단에 따르면, 최근 1년간 ‘인간 방문자 페이지뷰’가 약 8% 감소했대. 심지어 5~6월엔 사람인 척 위장한 AI 봇 트래픽이 폭증하기도 했다고. 이후 탐지 시스템을 업데이트하면서 감소하긴 했지만, 이건 명백히 AI 시대의 부작용을 보여주는 사례야.

결국 “AI가 위키백과의 지식을 가져가면서도, 정작 사람은 안 온다”는 문제. 기여자도 줄고, 후원금도 줄어드는 악순환으로 이어질 수 있지.

 

위키백과가 제시한 ‘AI 윤리 가이드라인’

위키백과는 단순히 “돈 내라” 수준이 아니라, 명확한 원칙을 제시했어. 그게 바로 AI 신뢰성의 3대 조건이지.

  1. 출처를 명시하라. - AI가 위키 데이터를 활용했다면 반드시 그 사실을 밝혀야 한다.
  2. 원본 접근성을 보장하라. - 사용자가 AI 요약만 보는 게 아니라, 위키 원문으로 이동할 수 있어야 한다.
  3. 기여자를 존중하라. - 위키백과는 집단 지성의 결과물이다. 그 공로를 인정하지 않으면 생태계 자체가 무너진다.

이건 단순한 윤리적 발언이 아니라, AI 생태계가 신뢰를 얻기 위한 ‘데이터 투명성의 핵심 원칙’이라고 봐야 해.

 

위키백과도 AI를 활용한다, 하지만 “인간 우선”

흥미로운 점은, 위키백과가 AI를 완전히 배척하는 건 아니라는 거야.
이미 내부적으로는 번역, 요약, 편집 자동화 등 일부 작업을 AI가 보조 역할로 돕고 있어.

하지만 재단은 분명히 못을 박았지.

“AI는 인간을 대체하지 않는다.”

 

이건 멋진 선언이야. AI를 도구로 쓰되, 정보의 중심은 여전히 ‘사람의 판단’이라는 것.
이런 균형감각이야말로 요즘 테크 업계가 가장 놓치고 있는 부분이라고 생각해.

 

“공짜 정보 시대의 끝”이 시작됐다

솔직히 이건 위키백과만의 문제가 아니야. AI 모델 대부분이 지금까지 공짜 인터넷 데이터로 훈련돼 왔잖아.
하지만 그 데이터의 출처가 있는 이상, 언젠가는 대가를 치러야 해. 이번 위키백과의 메시지는 “정보의 공공성과 지속가능성 사이의 균형”을 찾자는 제안으로 봐. AI가 성장할수록, 오픈데이터의 가치도 함께 인정받아야지.
그렇지 않으면 세상 모든 지식이 “대기업의 훈련 데이터”로만 소비되는 구조가 될 거야. 결국 AI 시대의 진짜 과제는 기술이 아니라 공정한 데이터 생태계야. AI가 위키백과를 필요로 하듯, 위키백과도 AI의 존중을 필요로 하는 관계.
이게 진짜 의미의 공생(coexistence) 아닐까?