계산의 배치: AXIOM
0부. 더 많은 칩이 아니라 다른 계산
Section titled “0부. 더 많은 칩이 아니라 다른 계산”AI 시대의 가장 쉬운 설명은 더 많은 GPU다. 학습과 추론, 거대 데이터센터와 메모리 대역폭, 전력과 냉각까지 지금의 인프라는 GPU를 중심으로 커졌다. 그 이유는 분명하다. 거대한 행렬과 텐서 계산을 같은 규칙으로 반복할 때 GPU는 압도적인 처리량을 낸다.
최근에는 CPU의 역할도 다시 주목받고 있다. 추론 서비스, 에이전틱 AI, 엣지 배치, 데이터센터 오케스트레이션은 GPU 코어 수 너머에 놓여 있다. 데이터가 어디에 놓이는지, 어떤 순서로 이동하는지, 어느 지점에서 기다림이 생기는지가 성능을 좌우한다.
이 흐름을 CPU의 귀환이라고 부를 수는 있다.
다만 이 표현은 현상을 부르는 이름에 가깝다.
더 무거운 것은 그 아래의 실행 조건이다.
GPU는 언제 강한가. 병렬성은 언제 줄서기로 접히는가. 넓은 메모리 통로는 언제 빈칸까지 나르게 되는가. 같은 계산이라도 표현과 배치를 바꾸면 하드웨어와 만나는 방식은 어떻게 달라지는가.
AXIOM은 마지막 질문에서 등장한다. 관심사는 CPU가 GPU를 이긴다는 단순한 이야기 너머에 있다. 어떤 계산 구조는 조밀한 텐서 연산으로 밀어붙이기 전에, 숨어 있는 묶음과 회전 구조를 드러낼 때 다른 경로를 갖는다. 계산의 모양이 바뀌면 병목의 위치도 바뀐다.
- 두 개의 뇌: CPU와 GPU의 설계 철학
CPU와 GPU의 차이를, 설계 철학의 차이로 다룬다. - 병렬성은 언제 접히는가: 직렬화
같은 자원으로 몰리는 순간 병렬성이 어떻게 줄서기로 바뀌는지 본다. - 데이터는 왜 새는가: 메모리와 콜레싱
메모리 접근 패턴이 어떻게 병목이 되는지를 본다. - 계산의 재배열: AXIOM
계산 표현과 배치를 바꾸면 하드웨어 적합도가 어떻게 달라지는지 확인한다. - 맺음: 계산은 어디에 놓이는가
결론을 병목 지도와 계산 배치의 가능성으로 마무리한다.