생각해보면 5090에 관심을 가지는 사람들은 확실히 기존 게이머와 수요가 다르다.

단적으로 일반 게임에서는 5090의 필요성을 느끼지 못한다. 이건 확실하다.

뭐…특수한 시뮬레이션 게임 환경에서는 5090조차 부족하겠지만,

많이 알려진 캐쥬얼 게임들을 하는 사용자에게는 전혀 필요치 않다.

심지어 5070정도면 충분하다.

5090까지 생각하는 시뮬레이션 게임을 하는 사람이라면 그건 사실 5090으로도 부족한 게임이다…그러니 게이머로서 5090은 그렇게까지 매력적이진 않다. 너무 비싸기만하거나 비싼데도 너무 성능이 부족한 물건이기 때문이다….

결국 나 자신도 5090이라는걸 생각하는건 LLM같은 것을 구동시키려 노력하다가 생각이 들게 된다.

그런데 RTX PRO 6000이라는게 나왔고 96GB의 사양이다. 그렇다보니 5090보다는 자연스레 거기에 눈이 간다.

물론 LLM은 이 엄청난 VRAM도 부족할 수 있으며 이것이 2~3장 있어야 할 수 있다.

당연히 사양에 따라 이 GPU 1장이면 충분히 가능하기도 하다. 아니 5090이면 가능하기도 하다.

더 낮게는 16GB의 VRAM을 가진 4080이나 5080같은 GPU로도 가능하기도 하다.

그러나 그만큼 성능이 떨어진다. 그런 욕구는 단순히 호기심이 아니라 챗 GPT를 겪고나서 생기는 것으로,

그것을 넘기는 성능을 원하게 되므로…..당연히 챗 GPT는 더 높은 스펙으로 작동하는 프로그램이니 당연히 그런 작은 VRAM으로는 만족할만한 성능이 나올 수가 없다.

그러다보니 당연히 그런 구성은 더이상 일반 PC가 아니라 서버 시스템 구축이 되어야 한다.

왜냐하면 그런 IO구성은 일반 PC에서는 물리적으로 불가능하기 때문이다.

GPU 3장 이상을 설치할 수도 없고, PCIE 슬롯이 3개가 있다고 하더라도 보통 2개만 그래픽카드를 인식할 수 있다. 속도 저하는 당연한 것이기도 하다. 물론 VRAM의 용량이 중요한 것이니 그렇게 중요하지 않을 수 있지만 당연히 차이가 있다.

그래서인지, 혹은 그나마 인텔이 살아남기 위한 여러가지 전략을 세워본 것인지, 아니면 특별한 기술적 발전을 할 수 없어서인지….. 인텔은 다음세대 노바레이크에서 코어수를 대폭 늘리는 다시말해 서버급 CPU를 일반 PC용으로 내겠다는 전략을 세웠다.

그에 맞춰서 메인보드 또한 최상급 Z990에서만이긴 하지만 PCIE 레인을 48개나 설정하고 있다.

https://videocardz.com/newz/intel-900-series-chipset-spcs-leaked-b960-z970-z990-q970-and-w980-for-nova-lake-s

그리고 npu또한 74 TOPS 정도의 성능으로 탑재한다고 하는데….이건 사실 GPU에 비하면 너무 소소한 크기라 아직은 그냥 가능/불가능 수준에서 가능은 하다 정도의 성능이라 봐야 할 것 같다. 차라리 인텔이 이런쪽이라도 잘 해서 맥킨토시 이상의 시스템 메모리로 구동 가능한 LLM이 가능한 하드웨어를 만들어 냈다면 좋았겠지만, 지금 인텔이 과연 그런걸 해 낼수 있을지 의문이다.

그러니 시스템 메모리를 사용해서 작동하는 방식의 LLM은 무리일테고 당연히 클로드봇을 사용하기도 턱없이 부족한 사양으로 보인다.

아무튼 점점 AI에 대한 관심 친숙도가 올라가는 만큼 개인들도 클라우드 방식의 CHAT GPT같은 것을 넘어서서 개인용 클로드봇 같은 AI비서 시스템을 원할테고 그것은 LLM을 필요로 하니…GPU의 수요는 여전하리라 본다.

또한 LLM이라는 것의 알고리즘이 근본적으로 바뀌지 않는이상…이건 그렇게까지 크게 바뀔 수는 없어보이긴 하는데,

많은 VRAM이 필요한건 확실해 보인다.

CUDA 기반으로 하는 이 시스템이 완전히 nVidia에게 독점되어있으며,

또 유일한 경쟁상대인 AMD Radeon은 이 부분에서 전혀 상대가 되지 않는 상황이다 보니…

앞으로는 점점 더 넓은 네트워크 대역폭, 더 많은 네트워크 기기들이 필요해지는 사회가 될 수 밖에 없는 것 같다.

예전에 유비쿼터스라는 말과 함께 IT붐이 있었던 것이 기억난다. 당시의 상상은 결국 조잡한 여러 기구가 아니라 스마트폰 하나로 정리가 되었다.

이번의 AI는 그런 단말기가 한 단계 더 진화하는 시점인 것 같다. 서버 하나에 단말기가 접속하는 것이 아니라,

각 단말기가 서버급의 성능을 가지고 그 서버가 전문화된 다른 서버와 통신하는 그런 구조가 되는 것이리라.

댓글 남기기