본문 바로가기

IT

2026년 6월 마지막 주, 지금 가장 핫한 IT 뉴스 TOP 5 총정리

728x90
반응형
728x170

IT 업계의 일주일은 보통 사람의 한 달쯤 됩니다. 커피 한 잔 내리고 돌아오면 AI 모델 순위가 바뀌어 있고, 어제 비싸다고 투덜대던 서비스가 오늘은 가격을 내리겠다고 합니다. 그래서 준비했습니다. 2026년 6월 29일 기준, 개발자든 그냥 IT 좋아하는 분이든 알아두면 대화에서 한 마디 거들 수 있는 가장 뜨거운 뉴스 다섯 개를 골라봤습니다. 흐름이 묘하게 다 연결되어 있으니, 끝까지 보시면 "아, 그래서 이게 이렇게 굴러가는구나" 하는 순간이 올 겁니다.

1. 중국 Z.ai의 'GLM-5.2' 등장, 오픈소스 AI가 코앞까지 쫓아왔다

이번 주 실리콘밸리를 가장 시끄럽게 만든 주인공은 미국 회사가 아니라 중국 스타트업 Z.ai(즈푸, Zhipu)였습니다. 6월 19일을 전후로 공개된 오픈소스 모델 GLM-5.2가 한 에이전트 벤치마크에서 Anthropic의 Claude Opus 4.8과 약 1퍼센트포인트 차이까지 따라붙었거든요. 그것도 비용은 대략 6분의 1 수준으로 말이죠.

 

더 무서운 건 "값이 싸서 그렇지 성능은 별로"라는 평가가 안 나온다는 점입니다. 작년 DeepSeek가 한 번 충격을 주고 챗봇 정도로 정리됐다면, GLM-5.2는 계획 세우기, 코딩, 테스트, 반복 루프 같은 에이전트형 작업에 강합니다. 요즘 기업들이 자동화하고 싶어 안달인 바로 그 영역이죠. 실제로 모델 중개 플랫폼 OpenRouter의 토큰 트래픽이 DeepSeek V4 출시 때보다 빠르게 치솟았다는 이야기가 나옵니다.

 

핵심만 정리하면 이렇습니다.

  • 오픈소스(오픈웨이트) 모델이라 누구나 가중치를 내려받아 자기 인프라에서 돌리고 미세조정할 수 있다.
  • 미국 최첨단 모델 대비 약 6분의 1 비용, 성능은 최상위권에 근접.
  • 다음 모델인 GLM-5.5가 8월 출시 예정이라 추격의 가속도가 붙고 있다.

개발자 입장에서 이건 단순한 국적 대결 구도가 아닙니다. "프런티어 모델 아니면 안 돼"라는 공식이 깨지기 시작했다는 신호에 가깝습니다. 그리고 이 흐름은 바로 다음 뉴스로 자연스럽게 이어집니다.

2. '토큰맥싱'의 황혼, 이제는 '효율성'의 시대

한동안 IT 업계엔 토큰맥싱(tokenmaxxing)이라는 신조어가 유행했습니다. 토큰은 AI가 처리하고 생성하는 데이터 단위인데, "토큰을 최대한 많이 쓰는 사람이 일 잘하는 사람"이라는 분위기가 있었죠. 일부 회사에서는 사내 리더보드까지 만들어서 누가 토큰을 더 많이 태웠나 경쟁했다고 합니다. 한때 엔비디아 CEO 젠슨 황이 "연봉 50만 달러 받는 엔지니어가 토큰에 연 25만 달러를 안 쓰면 깜짝 놀랄 일"이라고 말했을 정도니, 분위기가 어땠는지 짐작이 가시죠.

 

그런데 6월 26일자 CNBC 보도를 비롯해 여러 매체가 이 잔치가 끝나가고 있다고 전합니다. 이유는 단순합니다. 청구서가 무서웠거든요.

  • 우버는 연간 AI 예산을 단 4개월 만에 다 써버린 뒤, 코딩 도구당 직원 1인 월 1,500달러 한도를 도입했습니다.
  • AI 스타트업 Lindy의 CEO는 Claude 모델로 보내던 트래픽 100퍼센트를 더 저렴한 중국산 오픈웨이트 모델로 옮겼고, 몇 달 안에 수백만 달러를 아낄 것으로 기대한다고 밝혔습니다.

이제 업계의 화두는 "얼마나 많이 쓰느냐"가 아니라 "1달러로 얼마나 똑똑한 결과를 뽑느냐", 즉 달러당 지능(intelligence per dollar)으로 옮겨가고 있습니다. 그래서 요즘 실무에서 뜨는 개념이 모델 라우팅입니다. 쉬운 작업은 싸고 빠른 모델로, 어려운 작업만 프런티어 모델로 보내는 방식이죠.

 

마이크로소프트의 깃허브 코파일럿이 작업에 맞는 모델로 사용자를 자동 연결하겠다고 강조한 것도 같은 맥락입니다. 사티아 나델라 CEO는 6월 에세이에서 소수의 거대 모델에 모든 가치가 쏠리는 세상은 곤란하다는 취지의 글을 남기기도 했습니다.

3. 미국 정부, 프런티어 AI에 빗장을 걸다

2번 뉴스에서 "왜 다들 오픈소스를 기웃거리지?"라는 질문이 생겼다면, 답의 절반은 여기 있습니다. 미국 정부가 최첨단 AI 모델의 외부 접근을 조이기 시작했거든요.

 

보도에 따르면 OpenAI는 미국 정부의 요청에 따라 신규 모델(GPT-5.6 계열)을 신뢰할 수 있는 파트너에게만 제공하는 방향으로 제한에 나섰습니다. Anthropic도 자사의 최신 모델을 정부 지침을 준수하기 위해 오프라인으로 전환했다고 밝혔습니다. 다시 말해, 가장 강력한 모델일수록 아무나 쉽게 못 쓰게 되는 상황이 벌어진 겁니다.

 

흥미로운 건 이게 부메랑처럼 돌아온다는 점입니다. 미국이 빗장을 걸수록, 가중치를 그냥 내려받아 쓸 수 있는 GLM-5.2 같은 오픈소스 모델의 매력은 오히려 커집니다. 규제와 비용과 지정학이 한데 얽히면서, "최고 성능 모델"이 아니라 "지금 당장 합법적으로 쓸 수 있는 충분히 좋은 모델"을 찾는 분위기가 만들어지고 있는 셈입니다. 글로벌 공급망과 중장기 기술 전략을 짜는 기업 입장에서는 불확실성이 한 겹 더해진 한 주였습니다.

4. 삼성전자 'UFS 5.0' 개발 완료, 온디바이스 AI 시대의 저장장치

AI 이야기만 하다 보면 화면 안에서만 세상이 돌아가는 것 같지만, 결국 그걸 굴리는 건 하드웨어입니다. 6월 23일, 삼성전자가 업계 최초로 온디바이스 AI에 최적화한 모바일용 낸드 기반 저장장치 UFS 5.0 개발을 완료했다고 발표했습니다.

 

스펙이 꽤 화끈합니다. 9세대 V낸드를 기반으로 초당 10.8GB의 대역폭을 구현했는데, 이는 전작인 UFS 4.1 대비 2배 이상 향상된 수치입니다. 올해 4분기부터 양산에 들어가 차세대 스마트폰, XR 헤드셋, AI 웨어러블 기기 등에 적용될 예정입니다.

 

왜 저장장치 속도가 AI랑 상관일까 싶을 수 있는데, 구조를 보면 납득이 됩니다. 저장장치에 있는 데이터를 D램으로 빠르게 넘기고, AP(애플리케이션 프로세서)가 그걸 받아서 AI 연산을 수행하는 흐름이거든요. 길목이 좁으면 아무리 좋은 AP라도 답답해집니다. 클라우드에 안 보내고 기기 안에서 AI를 돌리는 온디바이스 AI가 늘어날수록, 이 "데이터 고속도로"의 폭이 곧 체감 속도와 응답성을 좌우하게 됩니다.

5. 차세대 반도체 패키징의 새 주인공, '유리기판'

마지막은 살짝 덜 유명하지만 업계에서는 조용히 뜨거운 주제, 유리기판입니다. 요즘 반도체는 CPU, GPU, HBM 같은 여러 칩을 하나의 기판에 욱여넣는 첨단 패키징이 대세인데, 칩을 많이 올릴수록 기판이 휘는 워페이지(warpage) 현상이 골칫거리로 떠올랐습니다.

 

여기서 유리기판이 차세대 대안으로 주목받고 있습니다. 6월 23일 보도에 따르면 유리기판은 열에 강하고 평탄도를 높게 유지할 수 있어, 큰 패키지에서도 변형을 줄이면서 더 많은 칩을 안정적으로 집적할 수 있다는 평가를 받습니다. 게다가 전기 신호와 광 신호를 함께 처리하는 공동패키징광학(CPO) 기술과 결합하면 차세대 플랫폼으로 확장될 가능성도 열려 있습니다. 유리 강자인 코닝이 이 사업의 성장성에 기대를 걸고 한국 기업과의 협력을 강화하겠다고 밝혀, 국내 소부장 업계에도 의미 있는 신호로 읽힙니다.

마치며: 한 주를 한 문장으로 요약하면

이번 주 IT 뉴스를 한 줄로 묶으면 이렇습니다. "성능 경쟁의 시대에서, 비용과 효율과 현실의 시대로 넘어가는 중." 오픈소스가 프런티어를 위협하고(1번), 기업들은 토큰 청구서를 보며 정신을 차리고(2번), 정부는 빗장을 걸고(3번), 그 모든 걸 실제로 굴리는 하드웨어는 묵묵히 빨라지고 있습니다(4번, 5번). 다음 주엔 또 무슨 일이 생길지 모르지만, 적어도 이 흐름을 알고 있으면 헤드라인이 훨씬 잘 읽힐 겁니다. 그럼 다음 IT 뉴스 정리에서 또 만나요.


참고 자료

 

728x90
반응형
그리드형