Ai 지식

끊이지 않는 논란의 딥시크 R1, 무엇이 진실일까?

heeline-1 2025. 2. 3. 03:48

최근 AI 업계에서 화제가 된 '딥시크(DeepSeek)'의 개발 비용과 혁신성에 대한 논쟁이 이어지고 있다. 딥시크의 최신 모델 '딥시크-V3'는 단 557만 달러(약 82억 원)라는 개발 비용으로 제작되었다고 발표되었지만, 이에 대한 반박이 나오면서 논란이 가열되고 있다.

딥시크-V3의 진정한 혁신성?

앤트로픽(Anthropic)의 CEO 다리오 아모데이는 최근 자신의 블로그를 통해 딥시크에 대한 견해를 밝혔다. 그는 '딥시크-R1'보다 한 달 앞서 출시된 '딥시크-V3'가 더 큰 혁신이라고 평가했지만, 557만 달러라는 개발 비용에는 의문을 제기했다. 또한, 미국의 AI 칩 수출 규제가 여전히 유효하며, AI 산업에서 리소스 투자가 중요하다고 강조했다.

아모데이 CEO는 딥시크-V3가 일부 작업에서 미국의 최첨단 모델과 견줄 만한 성능을 보인다고 인정하면서도, 비용 절감의 원인이 중국 기업의 독창적인 기술 때문이 아니라는 점을 강조했다. 그는 "딥시크의 추론 비용이 10배 이상 낮아졌다는 것은 LLM(대형 언어 모델)의 일반적인 비용 절감 추세를 반영한 것이며, 이는 특정 기업의 혁신 때문이 아니다"라고 분석했다.

딥시크의 실제 개발 비용 논란

반도체 분석 전문 매체 '세미애널리시스(SemiAnalysis)'는 딥시크의 개발 비용이 과장되었으며, 실제로는 5억 달러(약 7290억 원) 이상이 소요되었을 것이라고 주장했다. 이는 메타(Meta)가 '라마 3.1(LLaMA 3.1)'을 개발하는 데 사용한 비용과 동일한 수준이다.

세미애널리시스는 딥시크의 모회사 '하이-플라이어 퀀텀(High-Flyer Quantum)'이 수년간 GPU에 막대한 투자를 해왔으며, 현재 엔비디아(NVIDIA)의 최신 칩인 H800과 함께 H100, H20 등 다양한 호퍼(Hopper) 칩을 보유하고 있다고 지적했다. 이들이 보유한 GPU 서버에 대한 투자 비용만 해도 16억 2900만 달러(약 2조 3800억 원)에 달하며, 운영 비용까지 포함하면 25억 7300만 달러(약 3조 7600억 원)에 이른다는 분석이다.

또한, 딥시크의 인건비도 상당한 수준으로, 유망한 인재들에게 연봉 130만 달러(약 19억 원) 이상을하는 것으로 알려졌다. 이는 중국 AI 스타트업 중에서도 최상위 수준이다.

 

AI 추론 비용 절감과 모델 성능 평가

AI 모델의 추론 비용은 시간이 지나면서 지속적으로 낮아지는 경향이 있다. 예를 들어, 2020년 출시된 GPT-3의 추론 비용은 4년여 만에 1200배 이상 감소했다. 세미애널리시스는 이러한 비용 절감이 AI 업계 전반에서 자연스럽게 일어나는 현상이며, 딥시크가 유독 비용 절감에서 혁신적인 성과를 거둔 것은 아니라는 점을 강조했다.

딥시크-R1의 성능 평가에서도 과장이 있다는 분석이 제기되었다. 딥시크가 공개한 벤치마크 데이터는 일부 지표만 포함된 것으로, 실제로는 경쟁 모델인 오픈AI의 'o1'보다 앞선다고 단정할 수 없다는 것이다. 특히, R1보다 더 주목해야 할 모델로 구글의 '제미나이 2.0 플래시 싱킹(Gemini 2.0 Flash Thinking)'과 오픈AI의 'o3'가 언급되며, 이들 모델이 컨텍스트 길이 및 벤치마크 성능에서 우위에 있다는 점이 지적되었다.

미국의 AI 칩 수출 규제와 미래 전망

아모데이 CEO는 AI 개발에서 리소스가 가장 중요한 요소이며, 중국이 수출 규제를 우회해 기술 발전을 이루었지만, 결국 인프라 투자에서 한계를 겪을 수밖에 없을 것이라고 전망했다. 그는 "현재는 좋은 추론 모델을 생산할 수 있는 단계지만, 장기적으로 보면 스케일링 곡선의 한계가 명확해질 것"이라고 설명했다.

결국, AI 칩과 인프라를 확보하는 것이 AI 산업에서 지속적인 경쟁력을 유지하는 핵심 요소이며, 미국의 AI 칩 수출 통제는 여전히 효과적일 것이라는 결론이다. 이러한 맥락에서 미국 기업들은 앞으로도 AI 인프라에 대한 투자를 지속해야 한다는 점이 강조되었다.

결론

딥시크-V3는 AI 업계에서 주목할 만한 성과를 거두었지만, 실제 개발 비용이 발표된 것보다 훨씬 클 가능성이 크다는 분석이 잇따르고 있다. AI 모델의 추론 비용 절감과 성능 향상은 일반적인 기술 발전의 흐름이며, 중국의 AI 기술이 급격히 발전하고 있음에도 불구하고, 장기적으로는 인프라 투자와 GPU 확보가 중요한 요소로 남을 것이다. 미국의 AI 칩 수출 규제는 여전히 유효하며, 글로벌 AI 경쟁은 더욱 치열해질 전망이다.

반응형