세계 뒤흔든 딥시크 쇼크, 사설 바카라형 AI 모델에 힌트 주다

설립 2년도 되지 않은 중국 인공지능(사설 바카라) 스타트업 딥시크(deepseek)가 전 세계를 뒤흔들었다. 짧은 시간에 저비용으로 오픈사설 바카라의 GPT-4o, o1에 맞먹는 사설 바카라 모델을 만들었기 때문이다. 미국의 중국 무역 제재로 엔비디아의 H100과 같은 고성능 그래픽처리장치(GPU)를 쓸 수 없는 상황에서 알고리즘 개선, 모델 최적화 등을 통해 성능을 끌어올렸다. 딥시크의 성과를 바탕으로 향후 글로벌 사설 바카라 시장 경쟁은 인프라 스케일업을 넘어 소프트웨어 경쟁력까지 포함된 복합적 경쟁으로 확대될 전망이다.

◇ ‘가성비 甲’ 딥시크 사설 바카라

딥시크는 최근 두 가지 사설 바카라 모델을 발표했다. 하나는 작년 12월 출시한 대규모언어모델(LLM) ‘딥시크 V3’, 다른 하나는 지난달 20일 내놓은 논증(reasoning) 사설 바카라 모델 ‘딥시크 R1’이다.

딥시크가 세계적 관심을 끈 계기는 딥시크 R1이다. 오픈사설 바카라의 o1처럼 복잡한 문제를 논리적으로 해결하는 사고 사슬(CoT, Ch사설 바카라n of Thought) 기법을 활용한다. 무료로 쓸 수 있는 데다 성능도 o1 못지않아 화제가 됐다.

전문가들은 작년 5월 딥시크가 공개한 오픈소스 사설 바카라 모델 ‘V2’에 주목했다. 이 모델의 추론 비용은 100만 토큰당 1위안(약 200원) 수준이었는데 메타의 라마3 70B와 비교하면 7분의 1, 오픈사설 바카라 GPT-4 터보의 70분의 1에 불과했다. 중국에서는 V2 출시로 가격 경쟁이 벌어지기도 했다. 작년 11월에는 이를 개선한 모델 V3를 공개했다. 딥시크는 이 모델의 학습 비용이 557만달러(약 82억원)라고 밝혔는데 이는 메타의 라마 3.1(6억4000만달러) 대비 100분의 1도 되지 않는 금액이다. 딥시크가 밝힌 수치가 축소됐다는 의혹도 있지만 다른 사설 바카라 모델보다 훨씬 적은 비용을 들여 만들었다는 사실은 정설로 받아들여진다.

◇ 알고리즘 개선·최적화로 성능 끌어올려

딥시크는 엔비디아의 고성능 GPU인 H100 대신 성능이 절반 이하인 H800을 썼다. 미국은 중국의 사설 바카라 굴기를 막기 위해 2년 전부터 엔비디아가 중국에 첨단 칩을 파는 것을 금지했다. 중국 사설 바카라 업체들은 적은 수의 칩과 저성능 칩으로 사설 바카라를 훈련했다.

대신 딥시크는 소프트웨어 기법으로 제약을 극복했다. 이들은 전문가 기반 혼합(MoE, Mixture of Experts)이라는 기법을 적용했다. 사설 바카라 모델을 여러 분야의 ‘전문가’로 구분한 뒤 질의가 들어오면 관련 분야의 전문가만 이용하는 식이다. 딥시크의 기술보고서에 따르면 R1 모델의 파라미터(매개변수)는 6710억 개 수준이지만 질문이 들어오면 340억 개만 활성화하도록 만들어졌다. 기존 방식과 비교해 컴퓨팅 파워를 덜 쓰고 작업 속도도 빠르다. 오픈사설 바카라의 o1과 비교하면 메모리 사용량이 10% 수준인 것으로 알려졌다.

멀티헤드 잠재 어텐션(MLA, Multi-Head Latent Attention)도 딥시크의 혁신 기술로 손꼽힌다. 대규모 사설 바카라 모델이 정보를 처리하는 방식을 개선해 효율적으로 정보를 압축하고 처리할 수 있게 해준다. MLA는 입력된 정보의 중요한 부분을 추려내 요약하고 저장한다. 적은 메모리로 더 많은 정보를 처리할 수 있어 질문과 답변 양을 늘릴 수 있을뿐더러 사설 바카라의 응답 속도도 향상된다.

◇ “사설 바카라 모델 훈련 R&D … 韓 기업도 참고해야”

딥시크의 등장 이후 오픈사설 바카라, 구글 등 기존 사설 바카라 강자들이 새로운 모델을 잇달아 공개하는 등 경쟁도 치열해지는 모양새다. 오픈사설 바카라는 지난달 31일 논증 특화 사설 바카라 모델의 경량형 버전 ‘o3미니’를 정식 출시했다. 샘 올트먼 오픈사설 바카라 최고경영자(CEO)는 “우리도 (딥시크처럼) 오픈소스 전략을 찾아야 한다”며 “우리가 역사적으로 잘못된 길을 걸어왔다고 생각한다”고 말하기도 했다.

구글도 지난 5일 초경량 사설 바카라 모델 ‘제미나이 2.0 플래시 라이트’를 선보였다. 이전 모델인 제미나이 1.5 플래시와 같은 가격과 속도를 유지하면서 성능을 끌어올렸다. o3미니처럼 논증 특화 경량형 모델인 제미나이 2.0 플래시 싱킹도 공개했다.

딥시크 쇼크는 한국 사설 바카라 업계에도 많은 점을 시사하고 있다. 오픈사설 바카라, 구글, 마이크로소프트 등 미국 빅테크가 막대한 자금을 기반으로 GPU를 입도선매하는 상황에서 한국 기업이 경쟁력을 높이기 쉽지 않았다. 정혜동 정보통신기획평가원(IITP) 프로덕트매니저(PM)는 “딥시크는 사설 바카라 모델 훈련과 운용에 필요한 비용 곡선 법칙의 한계를 연구개발(R&D)로 극복할 수 있다는 기대를 높여줬다”며 “한국 기업과 정부에 긍정적 메시지를 주는 측면도 크다”고 말했다. 그는 “각국이 자국 이익과 언어, 문화에 특화된 사설 바카라 모델을 개발하고 있어 한국도 독자적 사설 바카라 모델을 전략 자산으로 꼭 갖춰야 한다”며 “컴퓨팅 파워, R&D뿐만 아니라 사설 바카라 생태계를 구성하는 인재 양성과 데이터 확보도 놓치지 말아야 한다”고 강조했다.

이승우 기자 leeswoo@hankyung.com