도대체 무슨 일이 있었던 걸까
AI는 매번 대화를 처음부터 읽는다
쉽게 설명하자면 이렇다.
AI한테 뭔가를 물어볼 때, AI는 매번 우리가 나눈 대화의 맥락을 처음부터 다시 읽는다. "아까 우리가 이런 얘기 했잖아요"라는 그 배경 정보를 매번 새로 처리하는 것. 이 작업이 생각보다 비용이 많이 든다.
그래서 AI 서비스들은 "캐시(Cache)" 라는 방식을 쓴다. 한번 읽은 내용을 잠깐 기억해두는 것이다. 마치 계산기에 중간 계산 값을 저장해두는 것처럼. 덕분에 매번 새로 읽는 것보다 훨씬 저렴하게 처리할 수 있다.
5분 캐시 vs 1시간 캐시
이 캐시에는 두 가지 옵션이 있다.
| 구분 | 내용 |
|---|---|
| 5분 캐시 | 5분 이상 쉬면 기억이 사라지고, 다음에 또 처음부터 읽어야 함 |
| 1시간 캐시 | 1시간 안에 계속 대화하면 기억이 유지됨 |
어떤 게 더 경제적인지는 당연히 알 것이다. AI를 활용한 코딩 작업은 특성상 오랜 시간 대화를 이어가는 경우가 많으니까. 잠깐 화장실 다녀오거나 커피 한 잔 마시고 돌아왔을 때도 기억이 유지되느냐 아니냐의 차이다.
3월에 조용히 바뀐 것
1시간 → 5분, 공지 없이
Anthropic(Claude를 만드는 회사)은 올해 2월부터 1시간 캐시를 기본으로 적용했다. 덕분에 같은 양을 써도 요금이 확 줄었고, 한도 초과도 잘 안 났다.
그런데 3월 6일을 기점으로 슬그머니 5분 캐시로 되돌아갔다.
공지도 없었다. 안내도 없었다. 그냥 조용히.
얼마나 달라졌나
결과적으로 같은 방식으로 AI를 쓰는데 비용이 약 25~30% 더 나가게 됐다. 구독제 사용자들은 한 번도 안 넘기던 월간 한도를 갑자기 초과하기 시작했다. 이번에 이걸 분석한 사람 기준으로는 3개월간 약 949달러(한화 약 130만 원)를 더 지출한 셈이다.
데이터는 명확했다. 두 대의 컴퓨터, 두 개의 서로 다른 계정에서 똑같이 3월 6일을 기점으로 변화가 나타났다.
이 일이 시사하는 것
"조용한 변경"의 문제
이 이슈가 불편한 이유는 돈 문제만이 아니다.
요즘 AI 도구들은 구독 모델로 많이 운영된다. 월정액을 내면 "알아서 잘 써지겠지" 하고 믿는 구조다. 그런데 서비스 내부 설정이 바뀌어도, 사용자는 알 방법이 없다.
내가 더 많이 쓴 것도 아닌데, 갑자기 비용이 올랐거나 한도가 빨리 찼다면? 그 원인을 사용자가 직접 파악하기란 거의 불가능에 가깝다.
이번엔 어떻게 밝혀졌나
Claude Code는 사용 로그를 파일로 자동 저장하는데, 한 개발자가 그 파일 11만 건을 직접 뜯어서 분석했기 때문에 밝혀진 것이다. 일반 사용자 입장에서는 엄두도 못 낼 일이다.
AI가 일상으로 깊숙이 들어올수록, 이런 "조용한 변경"이 우리 일상과 지갑에 미치는 영향도 커질 것이다. 가격 인상이나 서비스 변경은 명확하게 공지하는 게 당연한 거 아닌가 싶은데, 지금 AI 업계는 그 기준이 아직 많이 흐릿하다.
AI 서비스, 우리는 얼마나 알고 있나
스트리밍 서비스가 요금을 올릴 땐 메일이 온다. 통신사가 요금제를 바꿀 땐 문자가 온다. 그런데 AI 서비스가 내부 설정을 바꿔서 비용이 늘어도, 아무 연락이 없을 수 있다.
이 간극이 앞으로 AI 서비스가 풀어야 할 숙제 중 하나라고 생각한다.
마치며
이번 이슈는 Anthropic 측에 공식 확인 요청이 들어간 상태고, 아직 공식 답변은 없다.
의도적인 변경이었는지, 실수였는지도 모른다. 하지만 그것보다 더 중요한 건, 사용자가 알아야 할 변경을 사용자에게 알리지 않았다는 사실이다.
AI 서비스를 구독하고 있다면, 이런 "블랙박스" 같은 부분이 얼마나 많은지 한 번쯤 생각해볼 필요가 있다. 우리가 매달 요금을 내는 서비스라면, 적어도 "왜 갑자기 이렇게 됐는지" 정도는 설명해줘야 하지 않을까.