같은 도구를 쓰고, 비슷한 지시를 내리고, 엇비슷한 결과물이 나왔다. 어느 쪽이 더 잘한 건지 — 아직 아무도 확실한 답을 갖고 있지 않다. 그런데 조직들은 이미 측정을 시작했다.
올해 들어, 몇몇 대형 조직에서 조용히 움직이기 시작했다. 성과 평가 항목에 AI 활용을 공식으로 넣기 시작한 것이다.
같은 도구를 쓰고, 비슷한 지시를 내리고, 엇비슷한 결과물이 나왔다. 어느 쪽이 더 잘한 건지 — 아직 아무도 확실한 답을 갖고 있지 않다. 그런데 조직들은 이미 측정을 시작했다.
— Issue 033 취재 메모 · 2026어느 조직은 AI 도구 사용 빈도를, 어느 조직은 AI 기반 산출물의 비중을 지표로 시험하고 있다고 했다. 탁월한 활용자를 별도로 포상하는 곳도 생겼다. 측정 방식은 아직 제각각이지만, 방향만큼은 여러 곳이 비슷하게 가리키는 중이다.
그러자 현장에서 예상치 못한 반응이 나왔다. 사용량이 성과 신호가 되는 순간, 일부 구성원들이 실제 필요와 무관하게 AI 도구 사용 횟수를 의도적으로 늘리기 시작했다는 것이다. 사내 비공식 순위가 생기고, 그 순위를 올리기 위한 경쟁이 붙었다. 숫자가 평가를 대신하는 자리에 들어오면, 숫자를 부풀리는 인센티브가 따라온다 — 이건 AI 도구만의 이야기가 아니지만, 이번엔 그 속도가 유독 빠르다.
맥락 이 현상에 이름을 붙인 사람들이 생겼다. 사용량을 의도적으로 늘려 생산성 신호를 만드는 행태 — 평가 지표가 생기면 지표를 게임하는 행동도 생긴다는, 오래된 조직 원리가 여기서도 반복되고 있다.
옆 업계는 이미 더 앞까지 갔다. 창작 산업에서는 AI가 만든 결과물의 저작권 귀속이 법정 안으로 들어왔다. 작가·배우 조합은 협약에 AI 조항을 새로 넣었고, 코드 학습 데이터를 둘러싼 소송에서는 출처 표시 조건이 합의로 정리됐다. 게임 개발 현장에는 아직 공식 기준이 없다. 그러나 같은 질문이 이미 문 앞까지 와 있다.
이 논쟁은 지금 세 자리에서 동시에 벌어지고 있다. 각 목소리는 같은 현상을 보면서 서로 다른 것을 중심에 놓는다. 어느 쪽이 완전히 틀리지는 않다 — 그래서 정리가 어렵다.
사용 이력은 객관적이고, 지금 당장 수집할 수 있는 가장 손쉬운 지표다. AI 도구를 자주 쓰는 사람이 그렇지 않은 사람보다 변화를 더 빠르게 흡수하고 있다는 신호로 읽을 수 있다. 측정할 수 없으면 관리할 수 없다는 논리는 오래됐고, 이 맥락에서도 유효하다고 이 입장은 말한다.
조직 입장에서는 현실적인 이유도 있다. AI 도구 도입에 비용을 쏟은 이상, 그 효과를 어떤 형태로든 증명해야 한다. 사용량은 그 증명의 가장 가시적인 경로다. 완벽한 기준이 올 때까지 기다릴 수 없다는 것이다.
AI 도구를 열 번 써서 평범한 답을 얻은 사람보다, 두 번 써서 날카로운 결론을 낸 사람이 더 잘한 것이다. AI 도구의 출력 품질은 입력한 질문의 품질을 따른다 — 무엇을 물었는가, 어느 맥락에서 판단했는가, 그 판단이 결과를 어디로 이끌었는가. 사용 횟수는 이 과정의 어느 것도 측정하지 못한다.
이 입장에서 나오는 진단은 더 직접적이다. 사용량을 기준으로 삼으면, 잘 쓴 사람보다 많이 쓴 사람이 유리해진다. 그 결과는 AI를 정말 잘 쓰는 사람이 아니라, AI를 가장 바쁘게 돌리는 사람을 보상하는 조직이다.
세 번째 목소리는 앞선 두 논쟁이 공통으로 건너뛴 질문을 꺼낸다. AI와 사람이 함께 만든 결과물에서, 성과는 누구의 것인가. 기획서 초안을 AI가 잡았다면 그 방향을 정한 것은 누구인가. 코드 절반을 AI가 썼다면 그 코드의 완성도는 누가 보증하는가.
옆 업계의 법정 다툼은 이 질문에서 시작됐다. 저작권청은 순수하게 AI가 생성한 산출물에 대한 저작권 인정을 거부했고, 일부 소송에서는 학습 데이터 기여에 대한 출처 표시가 합의 조건이 됐다. 측정이나 평가 이전에, 기여의 개념 자체를 다시 정의해야 할지도 모른다.
A, B, C 세 입장이 같은 것을 두고 다투는 것처럼 보이지만, 사실 각각은 서로 다른 질문에 답하고 있다.
| 무엇을 보는가 | 어디서 무너지는가 | |
|---|---|---|
| Voice A | 활동의 밀도 — 얼마나 썼는가 | 잘 쓴 사람보다 많이 쓴 사람이 유리해진다 |
| Voice B | 판단의 품질 — 어떻게 썼는가 | 판단 과정을 기록하지 않으면 측정이 불가능하다 |
| Voice C | 기여의 귀속 — 누가 만든 것인가 | 이 정의 없이는 A도 B도 출발점이 없다 |
문제는 세 가지를 구별하지 않은 채 하나의 지표로 만들려 할 때 생긴다. "AI 활용 성과"라는 하나의 항목 아래, 사용량과 판단력과 기여 귀속이 뒤섞이면 — 무엇을 재고 있는지 모르는 지표가 된다.
그리고 지금 대부분의 조직이 그 혼합된 상태에서 측정을 시작하고 있다. 기준이 무엇인지가 행동을 만든다는 점에서 — 이건 가볍게 넘길 수 있는 문제가 아니다.
이 논쟁이 어떤 방향으로 정리되든, 지금 이미 일어나고 있는 일들이 있다.
기획서 초안을 AI가 잡았다면 — 그 기획의 방향은 누가 정한 것인가. QA가 AI 도구로 버그 패턴을 찾았다면 — 그 발견의 공은 어디에 있는가. 아트 레퍼런스를 AI로 뽑고 가공했다면 — 그 아트의 결은 누가 만든 것인가.
각각의 질문에 지금 당장 정답을 내놓는 건 이 호의 목적이 아니다. 다만 이것만큼은 확인하고 넘어갈 만하다. 이 질문들이 우리 현장에도 이미 와 있다는 것. 아직 공식 기준이 없다는 것. 그리고 그 공백 안에서 팀마다 다른 답이 비공식으로 자리잡고 있을 가능성이 있다는 것.
옆 업계가 법정으로 가져갔던 그 질문들이 — 게임 업계에 도달하는 건 시간 문제다. 그 전에 우리 스스로 어떤 언어를 갖고 있는지가 먼저인 것 같다. 기준이 오기를 기다리는 것과, 기준을 먼저 만들어 보는 것 — 두 태도 사이에 있는 조직이 어디에 있는지는 지금 각자가 알고 있다.
이번 호의 결론을 당신에게 미룬다. 정답은 정해두지 않았다. 점심 자리에서 한 번쯤 꺼내볼 만한 질문들이다.
결과물로 보이는가, 사용 이력으로 보이는가, 아니면 아직 합의된 기준이 없는가. 기준이 없다면 — 지금 사실상 무엇이 그 자리를 채우고 있는가.
그 사람의 역량인가, 도구의 역량인가. 둘을 나눌 수 있는가. 나눠야 하는가. 나누지 않아도 된다면, 그 이유는 무엇인가.
사용량인가, 판단 품질인가, 결과물의 완성도인가. 아니면 이 세 가지를 동시에 보는 어떤 방법이 있는가. 지금 당신의 팀이 그 기준을 만들어야 한다면 — 어디서 시작하겠는가.
이번 호를 준비하면서 편집부는 하나의 유혹과 계속 싸웠다. 결론을 먼저 정해두고 싶은 유혹이다. 판단력이 기준이어야 한다고, 혹은 사용량 측정은 결국 흔들릴 것이라고 — 깔끔한 한 줄로 정리하고 싶었다.
그런데 실제로 들여다보면, 어느 쪽도 아직 확실하지 않다. 실험은 진행 중이고, 사례는 쌓이는 중이다. 옆 업계의 법정 다툼도 아직 끝나지 않았다. 결론이 나지 않은 것을 결론처럼 쓰는 건 편집부가 할 수 있는 일이 아니었다.
그래서 이번 호는 결론보다 질문의 형태를 택했다. 세 입장이 각자 일부는 맞고, 일부는 아직 시험 중이다. 그 긴장 속에서 — 지금 당신이 있는 자리에서 무엇이 보이는지가, 이 호의 어떤 문장보다 중요하다.
한 가지는 확실하다. 이 질문이 게임 개발 현장에 도착하기 전에 생각해둔 사람과 그렇지 않은 사람 사이의 차이는 — 기준이 왔을 때 비로소 드러난다.
— Desk γ프로세스가 없는 상태에서 도구가 먼저 왔다. 그 첫 해를 어떻게 읽을 것인가.