ThinkforBL

2026-05-06

THINKFORBL COLUMN SERIES

[박지환의 인공지능 선긋기] 상황이 바뀌었다, AI 데이터 품질은 ‘정확도’가 아니다

더에이아이(THE AI)

각주구검(刻舟求劍)이라는 고사가 있다. 배를 타고 가던 사람이 칼을 물에 빠뜨리자, 칼이 떨어진 지점의 뱃전에 표시해두고 나중에 그 표시 아래에서 칼을 찾으려 했다는 이야기다. 표시가 틀린 것도 아니고, 칼이 떨어진 순간에는 분명 그 자리가 맞았다. 문제는 배가 움직였다는 데 있다. 시대 상황이 바뀌면, 기준도 바뀌어야 한다는 이야기다.

지금 인공지능(AI) 데이터 품질을 논할 때, 유사한 실수가 반복되고 있다. 데이터 품질이라는 말에서 우리는 자연스럽게 정확성, 완전성, 일관성 등 전통적 품질 특성을 떠올린다. 값의 수치가 맞는가, 누락 값은 없는가, 형식은 일관되는가의 기준으로 데이터 품질을 확인, 관리할 수 있다고 생각한다. 정형데이터 시대에는 그 기준이 맞았다. 그러나 생성형 AI가 비정형 데이터를 학습하는 시대에는 맞지 않는다. 단언컨대 지금 우리가 찾는 칼은 ‘정확성’이라는 자리에 없다. 산업의 배가 시대 물살을 타고 이미 다른 지점에서 움직이고 있기 때문이다.

데이터가 행정 기록, 거래 내역, 수치 정보처럼 명확한 필드에서의 값으로 구성되었을 때는 잘못 입력된 값을 바로잡고 누락을 줄이며 형식을 맞추면 품질을 관리할 수 있었다. 그러나 지금 우리에게 필요한 데이터들은 단순 기록들의 집합이 아니다. 현재의 AI는 스스로 상황을 이해해서 자체 판단, 행동하는데, 데이터는 그 기준을 형성하는 재료가 된다.

생성형 AI는 비정형 데이터 이면의 언어, 이미지, 문화, 관점, 가치판단을 학습한다. 산업 AI는 현장의 정상 상황과 비정상 상황, 위험 징후와 예외 조건을 학습한다. 에이전틱 AI는 주어진 목표를 달성하기 위한 경로를 스스로 찾기 위해 학습 데이터를 활용한다. 그렇다면 AI 학습을 위한 ‘좋은 데이터’는 이제 ‘계산이 정확한 값’을 양적으로 많이 축적한 파일들이 아니다. 각 AI가 수행하려는 목적에 맞게, 우리가 AI에 학습시키려는 현실 상황을 얼마나 충분히, 다양하게, 균형 있게 담고 있는가를 보아야 한다. 그것을 데이터 충실도라고 한다.

생성형 AI에 현 사회의 다수가 지닌 성차별, 인종차별 인식이 ‘정확히’ 반영된 데이터를 학습시킨다면 AI는 더 정확하게 악랄한 차별 콘텐츠를 만들어낼 것이다. 간호사를 그려달라고 하면 여성을 그리는 것, 전문가를 그려달라고 하면 안경 쓴 백인 남자를 그렸던 것이 그 예이다. 그러지 않게 하려면 사회적 편견을 정확히 반영하는 데이터가 아니라 윤리적, 문화적, 법적으로 균형이 잡힌 데이터를 제공해야 한다. 이것을 가치적 충실도라고 한다.

산업 AI에 현장의 정상 상황들에 대한 데이터를 정확하게 학습시킨다면, 해당 AI는 평상시 효율적으로 작동하다가도 정작 비정상 상황에서 아주 교과서적으로 정확한 오작동을 일으킬 수 있다. 이를 방지하려면 정상 상황뿐 아니라 예외 상황, 비정상 상황이 학습 데이터에 충분히 포함돼야 한다. 이를테면 고장 직전의 미세한 변화, 작업자의 예외적 개입, 온도와 습도 변화, 센서 오류, 불량 발생 조건 등이다. 이것을 물리적 충실도라 한다.

그런데 AI 데이터가 중요하다고 그토록 강조하면서도, 현장에서 데이터 품질 개선을 위해 하는 작업은 아직도 오타 찾기, 형식 점검에 그치고 있다. 단지 ‘정확한’ 데이터들의 집합으로는 지금 시대의 기준에 맞는 품질을 확보할 수 없다. 가치관이 잘못됐는데 문장부호만 바로잡는다고 올바른 내용이 될 리가 없다. 이렇게 잘못된 데이터로 학습한 AI가 잘못된 판단, 행동을 하게 되면, 다시 ‘데이터가 부족한가 보다!’라며 똑같은 작업을 반복한다. 악순환이다. 문제의 원인을 ‘데이터 부족’이 아니라 ‘충실도 부족’이라고 옳게 판단했다면 데이터의 내용을 들여다봤을 것이고, 거기에 어떤 상황이 빠졌는지, 어떤 예외가 고려되지 않았는지, 어떤 위험 조건이 반영되지 않았는지를 확인했을 것이다. 그게 아니라 데이터 양이나 정확도 같은 예전 기준에 얽매이다 보니, 공공데이터를 대상으로 충실도 진단을 하면 대부분 98% 이상 의미적 중복으로 나타나는 결과로 귀결되는 것이다.

AI는 더는 환자 차트를 깔끔하게 정돈해주는 간호 보조 역할이 아니다. 직접 환자를 진단하고 치료하는 의사 역할을 한다. 그런데 좋은 의사는 멀쩡한 사람을 백만 명 진찰하는 사람이 아니라, 한 명의 희귀 환자를 놓치지 않고 완치시키는 사람이다. 그렇기에 이제부터의 AI 강국은 단순 데이터를 많이 모든 나라가 아니라, 적은 인프라로 데이터의 의미를 적절하게 잘 관리하는 나라가 될 것으로 생각한다. ‘의미를 관리한다’라는 것은 데이터의 의미를 마음이나 진정성이 아니라 공학적 기준으로 접근, 판별한다는 뜻이다. 요컨대 데이터 충실도에 대해 표준화된 기준을 발 빠르게 정립, 산업에 적용해야 미래 경쟁력을 선점할 수 있다는 말이다. 그런 발 빠른 움직임을 시장에서는 혁신이라고 부른다.

학생 시절에 처음 각주구검 고사를 배울 때부터 의문이 있었다. 칼이 떨어진 자리 뱃전에 표시를 백날 해봤자 그 칼을 찾을 수 없다면, 도대체 뭘 어쩌라는 걸까? 지금은 이렇게 생각한다. 우선은 칼을 떨어뜨리지 말아야 했고, 떨어뜨렸다면 뱃전에 표시할 게 아니라 당장 뛰어들어 건져야 하며, 이미 배가 지나왔다면 그 칼은 뱃전의 표시와 함께 포기하고 새 칼을 사야 할 것이다. 격변기 산업의 배는 우리 생각 이상으로 급하게 물살을 타고, AI 데이터의 기준은 정확성에서 신뢰성, 충실도로 빠르게 이동 중이다. 뱃전의 표시로 다음을 기약하는 게 아니라 지금, 이 순간에 새 기준으로 뛰어들든가, 아니면 일찌감치 또 다른 기준을 선점하는 것이 혁신이다. 어느 쪽이든 정확도라는 과거의 기준에 매달리는 것은 데이터 품질 제고와 미래 경쟁력에 도움 될 게 없다는 것이 각주구검 고사가 시사하는 진의일 것이다.

[출처]

- 관련 기사 :
https://www.newstheai.com/news/articleView.html?idxno=20630

- 사진 :
씽크포비엘

MAGAZINE LIST

Company

Problem Solving Consulting

Trustworthy AI

Smart Livestock

Magazine

News