Processor.

프로세서 - 연도별 세대(Generation)설계(Architecture)에 따른 특징들을 소개합니다.


AMD Brand Logo 9000 시리즈 라이젠 프로세서, AM5 (2024년 8월, Granite Ridge)
- 9000 시리즈 라이젠 프로세서, AM5
Zen 기반 아키텍처 중 처음으로 L1 캐시 용량이 32KB에서 48KB로 증가했고 이에 따라 분기 예측 성능이 크게 증가했습니다. 코어간 데이터 공유를 담당하는 L3 캐시의 링버스 인터페이스도 개선되어 순환식 최단경로에 그치지 않고, 가능한 경우 슬라이스(뱅크)간 최단경로로 라우팅할 수 있도록 최적화 되었습니다. 이외에도 다양한 코어 로직의 증설 및 확장을 통해 성능 향상을 달성했습니다.

또한 전력 효율을 높이기 위해 누설 전류를 최소화 하는 등 실리콘 레벨의 최적화가 이루어졌고, 줄어든 전력 소비량은 발열 감소로도 이어져 공식적인 열설계전력(TDP, Thermal Design Power) 수치를 바꿀 정도로 유의미한 개선이 이루어졌습니다.

메모리 컨트롤러도 지원 대역폭이 최대 5600MT/s로 상승했으며 최대 확장용량도 192GB로 늘어났습니다. 메모리 용량 측면에서는 발표 당시 UDIMM 규격 단일 메모리의 최대 용량이던 48GB를 기준으로 정해졌지만, 이후 64GB 단일 메모리가 등장하면서 메인보드 제조사들의 BIOS 업데이트로 최대 256GB 확장이 지원되기도 합니다.

3D V-캐시를 탑재한 제품군도 개선이 이루어졌습니다. 기존의 공법은 CCD 위로 캐시 메모리를 적층했지만, 라이젠 9000시리즈부터 CCD 아래로 캐시 메모리를 적층할 수 있게 되면서 방열 효율이 증가했습니다. 발열을 효과적으로 제어할 수 있다는 판단이 있었는지 그동안 막혀있던 수동 오버클럭 제한까지 해제되어 인기를 더하기도 했습니다.
AMD Brand Logo 8000 시리즈 라이젠 APU 프로세서, AM5 (2024년 1월, Phoenix)
- 8000 시리즈 라이젠 APU 프로세서, AM5
AMD APU 프로세서는 노트북으로 대표되는 모바일 시장을 노리고 출시되는 경우가 많지만, 피닉스 아키텍처는 노트북을 넘어 UMPC 같은 핸드-헬드 디바이스용 제품이 먼저 출시되었을만큼 고성능 저전력화에 성공한 사례입니다.

중보급형 라인업인 라이젠 5, 3 제품군 중에는 Zen4c라는 특별한 코어가 사용되기도 했습니다. 코어의 핵심 구성요소는 Zen 4와 동일하지만 고밀도 라이브러리를 채택해 차지하는 실리콘 면적을 줄인 구조로, 과거 6세대 APU 프로세서인 카리조(Carrizo)와 마찬가지로 최대 잠재력을 다소 희생해 저전력 환경에서 높은 효율을 이끌어낼 수 있도록 했습니다. 물론 높은 클럭 스피드가 필요한 싱글-스레드 위주의 작업을 고려해 일부는 표준 Zen 4 코어를 탑재하여 균형잡힌 성능 곡선을 유지합니다.

이미 검증된 성능의 Zen 4를 탑재한 점도 주목할만 하지만, 그보다 더 큰 변화로는 GPU 코어가 드디어 GCN(Vega)에서 RDNA3 아키텍처 기반으로 변경되었다는 점 입니다. 이미 라파엘 프로세서에서 RDNA 코어를 탑재한 전적이 있지만, 디스플레이 출력에 의의를 둔 터라 성능면에서는 주목할 요소가 적었던 것이 사실입니다.

RDNA 아키텍처는 GCN에 비해 그래픽 컴퓨팅 성능을 좌우하는 단정밀도(FP32) 연산 효율이 크게 상승했고, 4nm로 미세화된 모놀리식(Monolithic) 실리콘 다이로 생산되어 컴퓨트 유닛(CU, Compute Unit) 탑재량도 최대 8-CUs(512-sp)에서 12-CUs(768-sp)로 늘어나 약 2배에 가까운 3D 그래픽 성능을 자랑합니다.
AMD Brand Logo 7000 시리즈 라이젠 쓰레드리퍼, TR5 (2023년 10월, Storm Peak)
- 7000 시리즈 라이젠 쓰레드리퍼, TR5
스톰 픽 기반의 라이젠 스레드리퍼 7000 시리즈는 Zen 4 아키텍처와 DDR5 메모리, PCI-Express 5.0 인터페이스를 도입한 하이엔드 데스크탑 및 워크스테이션용 프로세서입니다. 라이젠 7000 시리즈, 라파엘과 마찬가지로 최신 규격 메모리를 도입하면서 새로운 TR5 소켓 플랫폼과 함께 출시되었습니다.

이전 세대 라이젠 스레드리퍼 시리즈인 캐슬 픽이 Zen 2 아키텍처 기반임을 고려한다면 Zen 4 아키텍처는 구조 변경에 따른 클럭당 성능(IPC) 향상만 고려해도 한층 더 강력해진 성능을 기대할 수 있지만, 스톰 픽 설계는 한술 더 떠 4개의 CCD 배치를 추가해 최대 96C/192T의 압도적인 멀티-코어 구성을 지원합니다.

다만 96-코어의 최대 구성은 기업용 라이젠 스레드리퍼 프로 모델로만 출시되었고, 일반 소비자용 라이젠 스레드리퍼는 여전히 최대 64-코어 구성으로 제한되었습니다. 더군다나 메모리 컨트롤러 역시 프로 라인업은 8-채널, 스레드리퍼 라인업은 4-채널로 차등 적용되어 아쉬움을 더했습니다.

그러나 게이머의 입장에서는 클럭 스피드를 희생해가며 AM5 플랫폼 이상으로 코어 수를 늘릴 이유가 전무하고, 시뮬레이션이나 렌더링 작업을 수행하는 입장이라도 "동일한 코어 사양의 CPU에 약 300만원 이상의 비용을 절약할 수 있다면 메모리를 다소 희생한다"는 선택지가 존재한다는 점에서 충분한 메리트를 갖춘 라인업이라고 평가할 수 있습니다.
Intel Brand Logo 14세대 코어 프로세서, LGA 1700 (2023년 10월, Raptor Lake-S)
- 14세대 코어 프로세서, LGA 1700
인텔 14세대 코어 프로세서는 기존 랩터 레이크를 최적화한 리프레시 제품군으로 CPU 구조상 큰 차이는 없지만 Intel 7(10nm Enhanced SuperFin) 공정의 성숙에 따른 클럭 스피드 상승, 일부 라인업의 CPU 코어 구성을 조정해 라인업을 재정비하는 역할로 투입되었습니다.

랩터 레이크 아키텍처의 잠재력은 13세대에서도 충분히 입증되었지만, 최상위 라인업인 코어 i9 시리즈(8P+16E)의 다음가는 등급인 코어 i7(8P+8E) 시리즈의 코어 구성이 아랫 등급인 코어 i5(6P+8E)에 가까운 구성이라는 점이 아쉬운 점으로 꼽혔습니다. 이를 개선하고자 14세대 코어 i7 시리즈의 코어 구성을 8P+12E로 변경해 가격대비 성능을 끌어올리는 전략을 취했습니다.

비록 혁신적인 변화보다는 기존의 전략을 개선하는 선택이었지만, 랩터 레이크 이전 세대 프로세서 유저들의 업그레이드를 유도하기에는 충분한 메리트를 갖춘 편성으로 볼 수 있습니다.

또한 하이브리드 프로세서 구조의 장점을 극대화하기 위한 Application Optimization(APO) 튜닝 소프트웨어를 함께 선보이기도 했습니다. 이는 하드웨어 레벨에서 자동으로 동작하는 Thread Director와 달리 개별 어플리케이션에 대한 최적화 여부를 사용자가 직접 선택할 수 있어 리소스 관리를 더욱 쉽고 유연하게 할 수 있도록 해줍니다.
Intel Brand Logo 13세대 코어 프로세서, LGA 1700 (2022년 10월, Raptor Lake-S)
- 13세대 코어 프로세서, LGA 1700
인텔 13세대 코어 프로세서, 랩터 레이크 설계는 이전 세대인 엘더 레이크에서 아쉬웠던 부분을 보강하고 강점들은 더욱 발전시킨 구조적 개선판으로 출시되었습니다.

E-코어와 P-코어 조합으로 대표되는 하이브리드 아키텍처를 유지하면서 멀티-스레드 성능 향상을 위해 최대 16개의 E-코어, 8개의 P-코어를 지원해 24C/32T 구성이 가능해졌습니다. 싱글-스레드 성능 개선은 Thread Director 기술 최적화로 리소스 분배 효율을 높이는 한편, 최대 5.8GHz로 상승한 터보 부스트 클럭과 L2, L3 캐시 메모리 증설이 이루어졌습니다.

L2 캐시는 P-코어와 E-코어의 구조에 따라 증설량이 다릅니다. P-코어의 경우 코어당 1.25MB에서 2MB로, E-코어는 클러스터(4-코어)당 2MB에서 4MB로 늘어났습니다. 공유 L3 캐시는 3MB 슬라이스 구조로 엘더 레이크와 동일하지만, E-코어 클러스터당 L3 캐시 슬라이스 하나가 추가되면서 총량이 늘어난 셈입니다.

다만 물리적으로 코어 개수가 늘어난 만큼 소비 전력과 발열량(TDP, Thermal Design Power)은 다소 증가했습니다. 멀티-스레드 성능 향상폭에 비하면 납득할 수 있을 정도로 억제된 수준이긴 하나, 하이엔드 시스템을 구축할 시에는 강력한 쿨링 솔루션이 필요합니다.
AMD Brand Logo 7000 시리즈 라이젠 프로세서, AM5 (2022년 9월, Raphael)
- 7000 시리즈 라이젠 프로세서, AM5
라파엘 기반의 라이젠 7000 시리즈는 Zen 4 아키텍처, AM5 소켓 변경, DDR5 메모리 채택, PCI-Express 5.0 도입 등 프로세서 뿐만 아니라 플랫폼 레벨에서도 대대적인 변화를 가져왔습니다.

가장 근본적인 CPU 코어에 적용된 Zen 4 아키텍처는 기존의 7nm 공정에서 5nm 미세공정으로 바뀌어 더욱 높은 클럭 스피드 도달이 가능해졌고, 코어당 L2 캐시 용량이 두 배(512KB -> 1MB)로 늘어나 게이밍 환경처럼 캐시 적중률이 중요한 작업에서의 성능이 향상되었습니다. 또한 APU가 아닌 일반 CPU 제품군에서도 내장 그래픽(iGPU, Integrated GPU)이 기본 탑재되어 그래픽 카드가 없더라도 디스플레이 출력이 가능해졌습니다.

2016년 첫 도입 이후 5년간 유지해 온 AM4 소켓에서도 벗어나 AM5 소켓을 사용합니다. 이전 세대 프로세서와 호환성이 단절되는 플랫폼 업그레이드에는 여러가지 이유가 있을 수 있지만, 최신 메모리 규격인 DDR5 SDRAM를 채택하면서 신호 특성에 맞춘 회로 재설계가 핵심적인 역할을 한 것으로 보입니다.

새로운 AM5 소켓은 LGA(Land Grid Array) 1718 규격으로 그동안 AM4 소켓의 문제점으로 꼽히던 쿨러나 프로세서 교체시 CPU 뽑힘 현상을 방지할 수 있게 되었습니다. 물론 쿨러 장착에 필요한 물리적인 체결 수단은 최대한 호환성을 유지해 전용 백플레이트를 사용하는 일부 제품을 제외하면 그대로 사용할 수 있습니다.
Intel Brand Logo 12세대 코어 프로세서, LGA 1700 (2021년 11월, Alder Lake-S)
- 12세대 코어 프로세서, LGA 1700
엘더 레이크 아키텍처는 인텔의 데스크탑 PC용 프로세서 중 최초로 하이브리드 구조를 채택한 제품군입니다. 고성능 P-코어(Performance)와 고효율 E-코어(Efficiency)를 조합한 빅리틀(big.LITTLE) 방식으로 ARM 기반에서 주로 쓰이던 CPU 구성을 도입하면서 많은 주목을 받았습니다. 클러스터 구조의 고효율 E-코어 8개와 하이퍼 스레딩을 지원하는 고성능 P-코어 8개로 최대 16C/24T 구성이 가능합니다.

이러한 구조는 모든 코어를 활용할만큼 멀티-스레드 성능이 중요한 컨텐츠 크리에이터나, 8-코어 내외의 정해진 범주 내에서 높은 클럭 스피드에 기반한 빠른 처리속도를 중시하는 게이머, 전적으로 싱글-스레드 성능에 의존하는 레거시 어플리케이션 등 다양한 사용 환경에 알맞은 대응이 가능합니다.

물론 이상적인 성능을 보장하기 위해서는 리소스를 효율적으로 분배할 필요가 있으며, 이를 위해 새로운 스케줄링 기술인 스레드 디렉터(Thread Director)가 도입되었습니다. 다만 여느 최신 기술이 그렇듯이 호환성 문제로 최적의 성능을 내지 못하는 경우도 있어 바이오스 및 드라이버 업데이트를 통해 보완해나가는 모습입니다.

한편 DDR5 SDRAM 및 PCI-Express 5.0을 지원하는 등 이전까지 뒤쳐졌던 차세대 기술을 대거 도입했고, 주력 데스크탑 PC용으로는 처음으로 인텔 7(10nm Enhanced SuperFin) 미세공정에 기반해 이전 세대 제품들과 비교해 성능이나 효율성, 전력 관리 측면에서 많은 발전을 이뤘습니다.
AMD Brand Logo 5000 시리즈 라이젠 APU 프로세서, AM4 (2021년 4월, Cezanne)
- 5000 시리즈 라이젠 APU 프로세서, AM4
Zen 3 아키텍처 기반의 APU 세잔은 앞서 출시된 버미어가 그랬듯이 단일 CCX로 통합된 코어 덕분에 이전 세대 APU인 르누아르보다 더욱 뛰어난 성능을 제공합니다.

모바일 환경까지 고려한 저전력 설계를 위해 L3 캐시를 축소하는 APU의 구조상 두 개의 CCX를 묶는 르누아르의 Zen 2 아키텍처는 싱글-스레드 작업 환경에서도 4MB 이하의 L3 캐시 내에서 최고 성능(인피니티 패브릭 통신시 8MB)으로 사용 가능했습니다. 하지만 Zen 3 아키텍처의 세잔은 최대 16MB의 L3 캐시를 모두 활용할 수 있어 지연 시간이 대폭 줄어들고 캐시 적중률도 높아졌습니다.

내장 그래픽 코어는 르누아르와 마찬가지로 GCN 기반의 베가 코어를 사용해 공정 최적화에 따른 클럭 스피드 향상 및 전력 효율이 소폭 증가한 수준에 그쳤습니다. 여전히 CPU 내장 그래픽 코어 중에서는 준수한 편에 속하지만, 개별 그래픽 카드들의 성능이 압도적으로 높아진 상황이라 인상적인 모습을 보여주지는 못했습니다.

OEM 및 비즈니스용으로만 출시되었던 르누아르와 달리 일반 소비자용 제품군도 출시되었지만, 비교적 높은 가격대가 형성되어 미니 PC와 같이 용도가 확실한 소형 플랫폼 위주로 채택되었습니다. 결과적으로 데스크탑 시장보다는 노트북과 같은 저전력 모바일 시장에서 AMD 프로세서의 입지를 다진 제품으로 볼 수 있습니다.
Intel Brand Logo 11세대 코어 프로세서, LGA 1200 (2021년 3월, Rocket Lake-S)
- 11세대 코어 프로세서, LGA 1200
11세대 코어 프로세서는 데스크탑 CPU 라인업의 코드명을 이어서 로켓 레이크라는 이름이 붙었지만, 실질적으로는 서니 코브(Sunny Cove)로 불렸던 모바일 아키텍처의 공정 전환 및 고성능화를 꾀한 모델이라고 볼 수 있습니다. 10nm 미세공정의 고성능화가 지연되면서 수차례 최적화가 이루어진 14nm 공정으로 전환된 사례입니다.

기본적으로 스카이레이크의 개선판 격인 이전 세대 프로세서들에 비해 구조적인 변화를 꾀한 아키텍처답게 확실한 클럭당 성능(IPC) 향상을 기록했습니다. 인텔이 제시한 내부 테스트 자료에 의하면 이전 세대와 동일한 클럭 스피드에서 약 18%의 성능 향상을 이루었으며, 새롭게 추가된 AVX-512 명령어 세트를 활용할 경우 더 높은 연산 성능을 기대할 수 있습니다.

한 발 늦긴 했지만 PCI-Express 4.0 인터페이스를 도입해 하이엔드 그래픽 카드나 NVMe SSD 같은 고성능 확장장치 대응력을 높였고, 내장 그래픽 코어 또한 자사 Arc 그래픽 카드에 사용된 Xe 아키텍처 기반 GPU를 탑재해 경쟁사의 APU 라인업에 견줄 수 있을 정도로 준수한 성능을 자랑합니다.

다만 이러한 장점들에도 불구하고 10세대 프로세서에 비해 최대 코어 구성이 8C/16T로 줄어들어 멀티-스레드 작업에서는 성능이 떨어지기도 했고, 14nm 공정의 한계로 인한 전력 소모 및 발열 문제가 이어지는 등 새로운 시도와 아쉬움이 공존하는 과도기적 아키텍처라는 평가를 받았습니다.
AMD Brand Logo 5000 시리즈 라이젠 프로세서, AM4 (2020년 11월, Vermeer)
- 5000 시리즈 라이젠 프로세서, AM4
Zen 3 아키텍처가 적용된 버미어는 이전 세대와 동일한 7nm 미세공정을 유지했고, 겉으로 보이는 실리콘 다이의 크기나 배치도 비슷해보이지만 내부 구조의 개선으로 인상적인 클럭당 성능(IPC, Instructions per cycle) 향상을 이뤘습니다.

가장 큰 변화는 4-코어 CCX(Core CompleX) 두 개를 묶어 하나의 실리콘 다이로 만들던 CCD 구조를 온전한 8-코어 CCX 하나로 통합한 부분입니다. Zen 2 아키텍처는 CCD 내부에서도 CCX간 데이터 공유시 인피니티 패브릭(IF, Infinity Fabric)의 대역폭과 지연시간에 영향을 받았지만, Zen 3에 이르러서는 CCD 내부(8-코어) 리소스라면 L3 캐시를 통해 공유할 수 있게 되었습니다.

CCX 통합은 싱글-스레드 작업에도 긍정적으로 작용합니다. Zen 2 대비 L3 캐시가 두 배로 늘어난 효과를 누릴 수 있어 클럭당 성능에 큰 영향을 미치는 캐시 적중률이 높아지기 때문입니다. 이 점은 특히 8-스레드 이내의 실시간 데이터 처리가 주를 이루는 게이밍 분야에서 빛을 발합니다.

위와 같은 장점들을 극대화시킨 새로운 제품군으로 3D V-Cache 기술을 도입한 프로세서가 출시되기도 했습니다. TSV 수직 적층 공정으로 3배 더 많은 L3 캐시를 탑재한 라이젠 7-5800X3D 및 5700X3D 모델들은 더 많은 코어를 탑재한 라이젠 9 시리즈보다 뛰어난 게이밍 성능을 제공해 게이머들 사이에서 인기를 모으기도 했습니다.
AMD Brand Logo 4000 시리즈 라이젠 APU 프로세서, AM4 (2020년 7월, Renoir)
- 4000 시리즈 라이젠 APU 프로세서, AM4
르누아르는 Zen 2 아키텍처 기반으로 설계된 프로세서입니다. 1개 이상의 CCD(Core Complex Die)와 IOD(Input Output Die) 하나를 칩렛 구조로 배치한 마티스나 캐슬 픽과 달리 GPU까지 포함되는 APU(Accelerated Processing Unit)의 특성상 하나의 실리콘 다이로 통합된 모놀리식(Monolithic) 구조를 채택했습니다.

모바일 플랫폼에서도 사용되기 때문에 면적, 발열, 저전력 등의 이유로 공유 L3 캐시의 용량이 다소 줄었지만, 그럼에도 불구하고 최대 8C/16T의 코어 구성과 우수한 클럭당 성능(IPC, Instructions per cycle) 덕분에 고성능 노트북 시장에서 좋은 반응을 이끌어냈습니다.

함께 탑재된 GPU는 GCN(Graphics Core Next) 기반의 베가(Vega) 아키텍처입니다. 차세대 아키텍처인 RDNA가 출시되어 있긴 했으나 모바일에 적합한 코어 구성이 존재하지 않았고, 아직 1년여 밖에 지나지 않은 드라이버 소프트웨어의 안정성 등의 이유로 오랫동안 최적화가 이루어진 GCN 설계를 유지한 것으로 보입니다.

기본적으로 노트북 및 반/본체 데스크탑을 위한 OEM 공급 및 비즈니스 라인업인 Ryzen PRO 시리즈와 같은 제한적인 출시로 선보였지만, 시간이 지난 후 비즈니스 라인업을 일반 소비자용으로도 판매하기 시작하면서 미니 PC와 같은 SFF(Small Form Factor) 및 중-보급형 시스템에 주로 사용되었습니다.
Intel Brand Logo 10세대 코어 프로세서, LGA 1200 (2020년 4월, Comet Lake-S)
- 10세대 코어 프로세서, LGA 1200
코멧 레이크 아키텍처는 차세대 아키텍처로 전환하기 전까지 경쟁사 제품에 대응하기 위해 출시된 14nm 미세공정 기반 프로세서 라인업입니다. 이전 세대들과 비슷하게 스카이 레이크 아키텍처를 바탕으로 코어 개수 증가 및 클럭 스피드 향상을 통해 성능을 개선하는데 주력했습니다.

인텔의 일반 소비자용 프로세서로는 최초로 10C/20T 구성을 지원해 최상위 제품군의 멀티-스레드 성능을 개선하는 한편, 셀러론을 제외한 모든 제품군에 하이퍼 스레딩(HT, Hyper Threading) 기술이 적용되기도 했습니다. 터보 부스트 기술 또한 HEDT 라인업에서 사용되던 터보 부스트 맥스 3.0을 도입해 싱글-스레드 성능도 챙겼습니다.

코어 i9 라인업은 추가적인 클럭 스피드 향상을 위해 서멀 벨로시티 부스트(TVB, Thermal Velocity Boost) 기술이 도입되었습니다. 기존의 터보 부스트 클럭 이후로도 발열 수준에 여유가 있을 경우 더 높은 클럭 스피드로 작동합니다.

새삼스럽게도 이러한 개선들의 대가로 소켓 규격이 LGA 1200으로 바뀌어 새로운 메인보드로 교체가 필요해졌고, 미세공정의 큰 변화 없이 코어 개수와 클럭 스피드가 상승한 만큼 전력 소비량도 늘어났으며, 이에 따라 고급 쿨링 솔루션의 필요성이 크게 증가했습니다.
AMD Brand Logo 3000 시리즈 라이젠 쓰레드리퍼, TRX4 (2019년 11월, Castle Peak)
- 3000 시리즈 라이젠 쓰레드리퍼, TRX4
Zen 2 아키텍처를 기반으로 설계된 하이엔드 데스크탑(HEDT) 프로세서 라인업이며 마티스와 마찬가지로 CCD(Core Complex Die)와 IOD(Input Output Die), 인피니티 패브릭(Infinity Fabric)의 조합으로 구성됩니다.

일반 소비자용 프로세서로는 최초로 64C/128T 구성을 지원해 많은 주목을 받았으며, 쿼드-채널 DDR4 메모리 및 88개의 PCI-Express 4.0 레인을 지원해 하이엔드 데스크탑 제품군 다운 면모를 보였습니다. 다만 호환성을 유지한 AM4 플랫폼과 달리, 압도적인 CPU 코어 증가의 대가로 TR4 소켓에서 TRX4 소켓으로 변경되며 메인보드 교체가 필요합니다.

이외에도 TRX4 소켓의 넓은 PCB 기판에 실리콘 다이가 분산 배치되는 칩렛 구조의 특성상 쿨링 솔루션 구축이 까다로운 편이고, 늘어난 코어 개수만큼 전력 소비량도 높은 편이라 시스템 도입 전반에 걸쳐 상당한 비용 지불이 요구되기도 합니다.

그럼에도 불구하고 경쟁사의 HEDT 라인업 발표로 부터 불과 1개월도 지나지 않은 시점에서 최대 3배가 넘는 CPU 코어를 실장해 성능으로 압도, 하이엔드 데스크탑 시장의 주도권이 확실하게 AMD로 넘어오도록 만든 제품군임에는 틀림없습니다.
Intel Brand Logo 10000 시리즈 코어 X 프로세서, LGA 2066 (2019년 10월, Cascade Lake-X)
- 10000 시리즈 코어 X 프로세서, LGA 2066
인텔 10000 시리즈 코어 X 프로세서는 스카이레이크-X의 후속 아키텍처인 캐스케이드 레이크-X 설계를 기반으로 출시되었습니다. 최대 18C/36T 구성의 멀티-스레딩 능력과 높은 클럭 스피드로 싱글 스레드 성능을 극대화시켜 하드코어 게이머 및 콘텐츠 크리에이터를 겨냥했습니다.

쿼드-채널 DDR4 메모리 구성을 통해 최대 256GB에 달하는 DRAM 용량을 확보할 수 있으며, 이전 세대보다 늘어난 48개의 PCI-Express 레인을 지원해 다수의 그래픽 카드나 NVMe SSD 등 고속의 확장 카드 추가 또한 용이합니다. 특히 지난 시간동안 인텔을 끊임없이 괴롭혔던 멜트다운 및 스펙터 보안 패치가 적용되어 논란에 종지부를 찍기도 했습니다.

경쟁사의 일반 소비자용 데스크탑 제품군에도 경쟁이 가능한 모델이 있던터라 가격정책(MSRP) 역시 상당히 공격적으로 책정되어, 이전까지 출시된 코어 X 시리즈의 절반 수준에 가까운 인하폭을 제시하기도 했습니다.

그럼에도 불구하고 경쟁사에서 이미 도입한 PCI-Express 4.0을 지원하지 않았고(PCIe 3.0), 2018년 발표되었던 28C/56T의 프로토타입에 비하면 기대 이하의 성능으로 빛을 보지 못한 라인업으로 평가받았습니다.
AMD Brand Logo 3000 시리즈 라이젠 프로세서, AM4 (2019년 7월, Matisse)
- 3000 시리즈 라이젠 프로세서, AM4
AMD 라이젠 3000 시리즈 프로세서 마티스 플랫폼은 Zen, Zen+에 이어 Zen 2로 불리는 아키텍처를 채택했습니다.

마티스 아키텍처는 7nm 미세공정으로 설계된 CPU 코어(CCD, Core Complex Die)와 12nm 미세공정의 입출력 실리콘 다이(IOD, Input Output Die)를 분리하여 인피니티 패브릭(Infinity Fabric)으로 연결하는 칩렛(Chiplet) 구조를 도입했습니다. 이는 각 실리콘 다이의 생산성 및 멀티-코어 확장성을 높이는 한편, 발열 분산을 통해 성능 향상에도 도움이 되었습니다.

CPU 코어 증가 외에도 초기 라이젠 시리즈부터 지속해 온 캐시 메모리 구조 및 DRAM 컨트롤러 개선 등으로 이전 세대 대비 클럭당 성능(IPC, Instructions per cycle)을 약 10% 가량 끌어올렸고, 소비자용 데스크탑 프로세서 중 최초로 PCI-Express 4.0 인터페이스를 지원해 각종 확장 장치들의 성능 향상을 이끌어냈습니다.

특히 이러한 기술적 진보를 이뤘음에도 불구하고 AM4 소켓 기반의 플랫폼 호환성을 유지해 기존 사용자층의 업그레이드 부담을 줄인 것도 긍정적인 평가에 한 몫을 했습니다. AMD가 경쟁사 대비 기술 우위를 점하고 데스크탑 PC 시장에서의 입지를 다진 분기점으로 볼 수 있습니다.
AMD Brand Logo 3000 시리즈 라이젠 APU 프로세서, AM4 (2019년 7월, Picasso)
- 3000 시리즈 라이젠 APU 프로세서, AM4
AMD 라이젠 시리즈의 두 번째 APU 프로세서인 피카소는 Zen+(Pinnacle Ridge) CPU 아키텍처와 Radeon™ RX Vega GPU 아키텍처를 기반으로 설계되었습니다.

이전 세대인 레이븐 릿지(Raven Ridge)보다 향상된 12nm 미세공정을 도입해 더 높은 클럭 스피드와 전력 효율을 제공하며, 개선된 캐시 및 메모리 성능을 제공합니다. 공정변화 이외에도 히트 스프레더 접합부의 열 전달 방식이 금속 솔더링으로 바뀌어 발열 제어면에서도 유리해졌습니다.

이처럼 전반적으로 많은 개선이 이루어졌지만 그만큼 상위 라인업의 가격이 다소 비싸게 책정되었고, 상대적으로 보급형 모델 위주의 약진을 두드러지게 만들었습니다.

데스크탑 PC 라인업은 레이븐 릿지와 마찬가지로 라이젠 3 3200G(4C/4T), 라이젠 5 3400G(4C/8T) 두 모델이 출시되었으며, 노트북 PC 라인업은 라이젠 7, 5 시리즈에 이어 보급형 3 시리즈가 추가되었습니다.
Intel Brand Logo 9000 시리즈 코어 X 프로세서, LGA 2066 (2018년 10월, Skylake-X)
- 9000 시리즈 코어 X 프로세서, LGA 2066
인텔 코어 X 9000 시리즈는 공정, 설계, 최적화(PAO, Process - Architecture - Optimzation) 전략의 마지막 단계로 스카이레이크-X 설계를 바탕으로 공정 최적화가 적용된 리프레시 라인업입니다. 약간의 전력 효율성 개선과 더 높은 클럭 스피드로 전체적인 성능 향상을 꾀했습니다.

9세대 코어 프로세서와 마찬가지로 히트 스프레더(IHS, Integrated Heat Spreader)와 코어 사이의 열 전달 물질이 유체 혼합물에서 금속 접합 방식으로 변경, 발열 제어를 효과적으로 수행할 수 있어 오버클럭 안정성 및 지속 능력또한 향상되었습니다.

특히 이전 세대인 코어 X 7000 시리즈가 등급에 따라 44개와 28개로 차등 지원하던 PCI-Express 레인 역시 모든 제품군이 44개로 통일되어 하이엔드 데스크탑(HEDT, High-End DeskTop) 프로세서 다운 확장성을 보장하게 되었습니다.

다만 최상위 모델조차 경쟁사의 절반 수준의 멀티-코어 구성에 그쳤고, 확장성 역시 기존의 인텔 X299 칩셋 플랫폼이 유지되어 게이밍 성능의 이점에 비해 워크스테이션으로서의 메리트는 감소한 것으로 평가됩니다.
Intel Brand Logo 9세대 코어 프로세서, LGA 1151 v2 (2018년 10월, Coffee Lake-S)
- 9세대 코어 프로세서, LGA 1151 v2
인텔 9세대 코어 프로세서는 서밋 릿지 기반 프로세서가 출시되었을 때 빠른 대응으로 타이틀 방어에 성공했던 하이엔드 데스크탑(HEDT) 시장과 달리, 코어 개수나 종합 성능면에서 줄곧 비상이 걸려있던 컨슈머 시장에 대응하기 위해 커피 레이크 아키텍처를 리빌딩한 라인업입니다.

새롭게 신설된 코어 i9 시리즈는 경쟁상대인 라이젠 7 시리즈 대비 확실한 우위를 점하기 위해 8C/16T 구성으로 출시되었으며, 코어 i7 시리즈는 대응 가능한 수준인 8C/8T 구성으로 향상되었습니다. 코어 i5 이하 라인업은 클럭 스피드를 향상시키는 것으로 컨슈머 시장의 왕좌 탈환 및 종합 성능으로도 상대 우위를 가져가며 견제 라인을 구축하는데 성공했습니다.

Intel 9th Core Processor - Presentation Slide 01

다만 고클럭 고성능 링버스 설계인 커피 레이크 아키텍처 기반 코어가 추가되면서 발열이 큰 폭으로 증가했고, 이를 생산하기 위한 14nm++ 공정의 난이도 역시 동반 상승하면서 출하량이 수요를 따라가지 못해 실질적으로 페이퍼 런칭화 되었다는 평가를 받기도 했습니다.

이외에 특기할만한 사항으로는 상승한 발열을 감당하기 위해 실리콘 다이와 히트 스프레더 접합부 사이의 열 전달 물질이 유체 혼합물(Thermal Paste)에서 금속(Indium)으로 바뀌었습니다.

Intel 9th Core Processor - Presentation Slide 02 Intel 9th Core Processor - Presentation Slide 03

AMD Brand Logo 2000 시리즈 라이젠 쓰레드리퍼, TR4 (2018년 8월, Colfax)
- 2000 시리즈 라이젠 쓰레드리퍼, TR4
공정 최적화와 레이턴시 개선에 그친 컨슈머 라인업과 달리, 엔터프라이즈급 워크스테이션 라인업까지 발을 담그는 하이엔드 데스크탑(HEDT) 라인업은 상당히 큰 변화를 맞이했습니다. 4개의 CCX 패키지 모듈을 모두 활용해 최대 32-코어 구성이 가능한 WX 시리즈가 등장했기 때문입니다.

이로써 데스크탑 PC 에서도 서버급 프로세서인 에픽(EPYC)에 버금가는 코어 수를 달성하게 되었지만, 4개의 CCX 패키지 모듈 중 2개는 확장 입출력 인터페이스가 비활성화된 연산 전용 컴퓨트 코어(Compute Core)로 작동하도록 설계해 차별화를 꾀했습니다.

AMD Ryzen TR 2000-series Processor - Presentation Slide 01

라이젠 쓰레드리퍼 WX 프로세서 시리즈는 32C/64T (2990WX) 모델과 24C/48T (2970WX)로 출시되었습니다. 멀티 코어를 효과적으로 활용하는 어플리케이션에서는 압도적인 성능을 제공하지만 클럭 스피드가 다소 낮은 편이며, 물리적으로 추가된 코어 수 만큼 전력 소비량도 늘어나 메인보드의 부담이 커졌다는 평가를 받고 있습니다.

기존의 라이젠 쓰레드리퍼 X 프로세서의 뒤를 잇는 모델인 2950X는 2개의 CCX 패키지 모듈을 사용하는 16C/32T 구성은 동일하지만, 피나클 릿지의 레이턴시 개선 효과와 약 10% 상승한 클럭 스피드를 바탕으로 향상된 성능을 제공합니다.

AMD Ryzen TR 2000-series Processor - Presentation Slide 02 AMD Ryzen TR 2000-series Processor - Presentation Slide 03

AMD Brand Logo 2000 시리즈 라이젠 프로세서, AM4 (2018년 4월, Pinnacle Ridge)
- 2000 시리즈 라이젠 프로세서, AM4
가장 핵심적인 변화는 제조 공정인 글로벌 파운드리 14nm에서 12nm 미세공정으로 마이그레이션했다는 점입니다. 다만 실제로 선폭을 감소시켰다기보다는 동급의 공정 기술내에서 향상된 정밀도를 갖추고 특성 개선을 이뤘으며, 이를 마케팅적 의미에서 12nm로 표현했다고 볼 수 있습니다.

1세대 라이젠의 약점으로 지적되던 캐시 및 메모리 성능이 개선되었습니다. L1 캐시의 반응속도(Latency)를 13%, L2 캐시는 34%, L3 캐시 16% 가량 단축시켜 클럭당 성능(IPC)을 향상시킬 수 있었습니다. 물리적인 설계 디자인 변화는 없었지만 경쟁사의 전략 중 틱(Tick) 또는 최적화(Optimization) 단계에 속하는 세대 교체로 볼 수 있겠습니다.

AMD Ryzen 2000-series Processor Presentation Slide 01

2세대 프리시전 부스트는 이미 레이븐 릿지에서 구현된 알고리즘에 따라 코어/쓰레드 워크로드 수준에 따라 클럭 스피드를 유동적으로 제어할 수 있게 됩니다. 베이스 클럭 / 멀티-코어 부스트 / 싱글-코어 부스트로 경직된 변화만 이루어지던 1세대에 비해 더 효과적인 성능 향상을 제공할 것으로 기대됩니다.

쿨링 솔루션의 성능에 따라 프리시전 부스트 이상의 클럭 스피드로 가속시켜주는 확장 클럭 범위(XFR, eXtended Frequency Range) 기술도 버전업을 거쳤습니다. 1세대 XFR 기술은 엄격한 TDP 제한으로 사실상 수냉에서나 간혹 볼 수 있는 수준에 그쳤지만, 이제는 레이스 맥스(Wraith Max)급 이상의 공냉 쿨러를 사용한다면 충분히 효과를 볼 수 있게 되었습니다.

AMD Ryzen 2000-series Processor Presentation Slide 02 AMD Ryzen 2000-series Processor Presentation Slide 03

AMD Brand Logo 2000 시리즈 라이젠 APU 프로세서, AM4 (2018년 2월, Raven Ridge)
- 2000 시리즈 라이젠 APU 프로세서, AM4
AMD 라이젠(Summit Ridge)을 바탕으로 설계된 첫 번째 가속 프로세서(Accelerated Processing Unit, APU) 입니다. 전통적인 CPU에 그래픽 및 병렬 컴퓨팅 가속이 가능한 GPU 코어를 통합한 모델로 보급형 데스크탑 PC 및 모바일 시장에서 아쉬웠던 부분을 잘 메꿔준 라인업입니다.

기존 서밋 릿지의 단일 CCX 모듈에서 L3 캐시를 절반 덜어내는 대신 라데온 RX 베가(Radeon™ RX Vega) 기반의 차세대 컴퓨트 유닛을 최대 11개(704sp)까지 탑재할 수 있는 사양으로 출시되었습니다. 실리콘 다이 상으로는 CCX 모듈과 GPU 모듈이 인피니티 패브릭으로 연결된 형태이며, 이에 따라 CPU 코어는 최대 4C/8T 구성을 취할 수 있습니다.

AMD Ryzen 2000G-series Processor - Presentation Slide 01

데스크탑 PC의 경우 고성능으로 갈수록 통합 그래픽 코어보다는 전용 그래픽 카드를 추가로 탑재하는 경우가 많다는 점을 고려해 보급형 라이젠 3 2200G(4C/4T), 중~보급형 라이젠 5 2400G(4C/8T) 모델이 출시되었습니다.

노트북 PC는 일반적으로 업그레이드가 제한적이라는 점을 고려해 가격대 성능비가 우수한 라이젠 5, 고성능 라이젠 7 모델로 출시되었습니다. 두 프로세서 모두 4C/8T 구성이며 클럭 스피드만 0.2GHz 차이를 보입니다. 대신 노트북에서 확보하기 힘든 GPU 코어는 각각 512개(Vega 8), 640개(Vega 10)로 비교적 큰 편이며, CPU와 동일한 클럭 차이도 있어 실질적인 차별화 수단으로 활용되었습니다.

AMD Ryzen 2000G-series Processor - Presentation Slide 02 AMD Ryzen 2000G-series Processor - Presentation Slide 03

Intel Brand Logo 8세대 코어 프로세서, LGA 1151 v2 (2017년 8월, Coffee Lake-S)
- 8세대 코어 프로세서, LGA 1151 v2
인텔 8세대 코어 프로세서, 커피레이크 시리즈는 두 차례 최적화 작업을 거친 14nm++ 공정으로 디자인 된 프로세서입니다. 소비자용 데스크탑 프로세서로는 2세대 샌디브릿지 이후 줄곧 이어져 온 4-코어(8-스레드) 체재를 처음으로 6-코어(12-스레드)까지 끌어올린 기념비적인 라인업이기도 합니다.

커피레이크의 실리콘 다이 면적은 149mm2로 알려져 122mm2의 스카이레이크 / 카비레이크 보다 약 20% 더 커졌습니다. 기본적으로 "코어의 3면을 L3 캐시가 감싸는" 스카이레이크 배치를 그대로 따르고 있으며, 코어 2개가 추가되어 3열로 구성되는 차이가 있습니다. 그 외 I/O 구성, 메모리 컨트롤러, 내장 그래픽 코어 등은 변함 없이 동일합니다.

Intel 8th Core Processor - Presentation Slide 01

인텔 8세대 코어 프로세서의 주요 활용처는 게이밍, 컨텐츠 생산, 그리고 오버클러킹입니다. 엔터테인먼트에 특화된 라인업임에도 코어 개수를 50% 늘려 멀티스레드 성능을 대폭 향상시켰을뿐만 아니라, 역대 최고의 싱글-코어 클럭을 달성해 기존 어플리케이션들의 성능도 함께 견인하는데 성공했습니다.

오버클러킹 지원에 관해서는 두 가지 특기할만한 사항이 있는데, 그 동안 메인보드 제조사 차원에서 제공해왔던 개별 코어 오버클럭(Per-core)실시간 램타이밍 제어(Real-time Memory Timing)를 공식적으로 지원하게 되었습니다.

Intel 8th Core Processor - Presentation Slide 02 Intel 8th Core Processor - Presentation Slide 03

AMD Brand Logo 1000 시리즈 라이젠 쓰레드리퍼, TR4 (2017년 8월, Whitehaven)
- 1000 시리즈 라이젠 쓰레드리퍼, TR4
AMD 라이젠 쓰레드리퍼(ThreadRipper) 프로세서는 2개의 CCX 패키지 모듈(Zepplin)을 묶어 멀티-쓰레드 성능을 극대화한 하이엔드 데스크탑 프로세서입니다.

물리적으로는 서버용 프로세서인 에픽(EPYC)과 동일하게 4개의 CCX 패키지 모듈을 얹은 모양새지만, 그 중 2개는 생산과정에서 통과하지 못한 실리콘 덩어리입니다. 발열 분산을 위해 덮는 금속 히트-스프레더의 균형을 잡기위해 자리를 채우는 더미(Landfill)로 회로 자체가 연결되지 않기 때문에 유서깊은 코어부활은 불가능합니다.

AMD Ryzen TR 1000-series Processor - Presentation Slide 01

멀티 칩 모듈(MCM) 패키징으로 설계 난이도를 낮춰 높은 가격대 성능비를 구축했습니다. 일반적으로 프로세서를 MCM 방식으로 설계할 할 경우 코어간 통신을 중계하기 위해 메인보드 칩셋을 경유하는 비효율적인 방법을 사용해야 했지만, AMD는 이러한 패널티를 피하기 위해 인피니티 패브릭(Infinity Fabric)이라는 새로운 허브 인터페이스를 내장해 코어끼리 직접 통신회로를 연결할 수 있도록 설계했습니다.

인피니티 패브릭의 대역폭은 시스템 메모리(DRAM) 클럭과 동기화되는데, 현 시점에서 주력으로 사용되는 DDR4-2400 메모리로는 네이티브 공유 캐시(주로 L3)에 비해 대역폭이나 레이턴시 반응이 다소 부족한 편 입니다. 하지만 특별히 조치를 취하지 않아도 시간이 흐를수록 발전하는 DRAM 기술의 반사이익을 누릴 수 있을 것으로 기대됩니다.

AMD Ryzen TR 1000-series Processor - Presentation Slide 02 AMD Ryzen TR 1000-series Processor - Presentation Slide 03

Intel Brand Logo 7000 시리즈 코어 X 프로세서, LGA 2066 (2017년 6월, Skylake-X)
- 7000 시리즈 코어 X 프로세서, LGA 2066
인텔 코어 X 프로세서의 상위 라인업을 담당하는 스카이레이크-X는 코어 i9라는 새로운 포지션과 함께 이전 세대 대비 최대 80% 증가(10->18)한 네이티브 물리-코어 프로세서로 설계되는 파격적인 행보를 내딛었습니다.

이런 급격한 변화의 일환으로 내부 구조면에서 대대적인 개선이 이루어졌습니다. 약 10년간 유지해오던 링버스(Ringbus) 내부 순환 인터페이스를 그물망(Mesh) 직결 구조로 변경, 코어대 코어간 데이터 공유시 발생하는 지연시간을 최소화 할 수 있도록 했습니다.

Intel Core X 7000-series Processor - Presentation Slide 01

언코어 영역에서도 주목할만한 변화가 있었습니다. 그물망 인터페이스 구성으로 인해 공유 캐시(L3)보다 각 코어별 프라이빗 캐시의 비중이 더 커지면서 L2 캐시와 L3 캐시의 리밸런싱이 이루어졌습니다. L2 캐시 크기는 코어 당 1MB로 기존 256KB 대비 400% 증가했고, L3 캐시는 1.375MB로 감소해 55% 수준으로 조정되었습니다. 중간 레벨 캐시 적중률이 증가함에 따라 하위 캐시가 굳이 상위 캐시에 포함된 데이터를 전부 가지고 있을 필요가 없어지면서, 하위 캐시들의 정책 또한 포괄적(Inclusive) 방식에서 배타적(Exclusive) 방식으로 바뀌었습니다.

이외에도 성능 향상을 위한 최적화 기술인 인텔 터보 부스트 맥스 3.0(Intel Turbo Boost Max 3.0)도 강화되었습니다. 이전 세대까지의 터보 부스트 맥스 기술은 싱글-코어 기반 프로그램의 성능을 높이기 위해 가장 뛰어난 컨디션을 가진 코어 하나를 할당해주는 기능이었지만, 스카이레이크-X 기반 프로세서부터 듀얼-코어까지 지원할 수 있도록 개선되었습니다.

Intel Core X 7000-series Processor - Presentation Slide 02 Intel Core X 7000-series Processor - Presentation Slide 03

AMD Brand Logo 1000 시리즈 라이젠 프로세서, AM4 (2017년 2월, Summit Ridge)
- 1000 시리즈 라이젠 프로세서, AM4
AMD 라이젠은 이전 세대 프로세서 불도저 라인업의 출시 이후 약 5년 만에 선보인 새로운 설계의 프로세서입니다.

아키텍처 레벨에서 특별히 주목할만한 점은 AMD 프로세서 설계 역사상 처음으로 동시 멀티-스레딩(Simultaneous Multi-threading) 기술을 도입해 1-코어당 2-스레드를 병렬 처리할 수 있게 되었고, 인텔의 마이크로 옵(μOps)에 해당하는 옵 캐시(Ops Cache)를 신설한 덕분에 클럭당 성능(IPC)이 크게 향상되었습니다.

최신 프로세서에서 빠질 수 없는 최적화 동작 알고리즘 역시 AMD SenseMI Technology라는 명칭과 함께 다섯 가지 기능을 강조했습니다.

AMD Ryzen 1000-series Processor - Presentation Slide 01

퓨어 파워(Pure Power)프리시전 부스트(Precision Boost)는 물리적으로 실장된 실시간 전압 / 온도 측정 센서를 활용해 인가되는 전압을 상황에 맞게 조절하거나, 25MHz 단위로 더욱 섬세하게 동작 클럭을 향상시킬 수 있도록 해줍니다. 한편, XFR(eXtended Frequency Range) 기능은 임계 온도가 넘었을 때 베이스 클럭보다 성능을 낮추는 쓰로틀링(Throttling)과 상반되는 개념으로 프로세서가 일정 수준보다 낮은 온도로 동작할 때 프리시전 부스트 시나리오 상의 클럭보다 높은 성능으로 동작하게 됩니다.

신경망 예측(Neural Net Prediction)스마트 프리페치(Smart Prefetch)는 명칭(Pre)에도 드러나듯이 연산에 필요한 명령이나 경로를 반복되는 데이터 패턴에서 학습하여 추측, 미리 준비함으로써 더 빠르게 반응할 수 있도록 해줍니다.

AMD Ryzen 1000-series Processor - Presentation Slide 02 AMD Ryzen 1000-series Processor - Presentation Slide 03

AMD Brand Logo 7세대 APU 프로세서, AM4 (2016년 9월, Bristol Ridge)
- 7세대 APU 프로세서, AM4
브리스톨 릿지는 익스카베이터(Excavator) CPU 코어와 그래픽 넥스트 코어(GCN) GPU 코어를 내장하며, DDR4 메모리를 지원하는 최초이자 최후의 중장비 계열 코드네임을 가진 프로세서입니다. AM4 소켓 기반의 프로몬토리(Promontory) 플랫폼 설계로 라이젠 프로세서와 호환이 가능하지만 PCI-Express 레인 및 세대에 따른 대역폭 차이가 있습니다.

실질적인 연산부(ISA, Instruction Set Architecture) 구조는 이전 세대인 카리조와 동일하지만, 메모리 컨트롤러 차이로 대규모 병렬 실행 및 OpenCL 기반 범용 컴퓨팅 성능이 다소 향상되었습니다. 또한 AVFS(Adaptive Voltage & Frequncy Scaling) 기능을 활용해 실리콘 레벨에서 전압과 클럭의 여유분만큼 가속하되, 신뢰성 추적기(Reliability Tracker)로 안정성을 초과하는 부스팅이 일어나지 않도록 제어합니다.

AMD Bristol Ridge Processor - Presentation Slide 01

또한 노트북은 내부 시스템보다 바깥쪽 표면의 온도가 낮다는 점을 활용해 운영체제 부팅이나 어플리케이션 실행 시, 노트북 표면 온도가 임계점에 도달할 때 까지 최대 성능으로 작동하는 STAPM(Skin Temperature Award Power Management) 기능이 도입되었습니다. 일정 온도에 도달하면 표준 성능으로 전환되지만, 그 동안 처리한 데이터만큼 작업량이 줄어들기 때문에 전력 소비량이 소폭 감소하게 됩니다.

이외에도 부팅할 때 마다 자체 구동전압 조정(Boot Time power supply Calibration) 기능을 통해 PC를 사용할 때 마다 실리콘으로 공급되는 전력을 체크해 출하시 상태를 유지할 수 있도록 해줍니다. 전반적으로 모바일 시장에 유용한 기술들이 많이 추가되었으며, 실제로도 가격 경쟁력을 갖춘 노트북 제품이 주를 이루고 데스크탑용 모델은 최소한으로 출시(1개)되었습니다.

AMD Bristol Ridge Processor - Presentation Slide 02 AMD Bristol Ridge Processor - Presentation Slide 03

Intel Brand Logo 7세대 코어 프로세서, LGA 1151 (2016년 8월, Kaby Lake-S)
- 7세대 코어 프로세서, LGA 1151
인텔이 기존의 로드맵 전략인 틱-톡을 폐기하고 미세화(Process) - 설계(Architecture) - 최적화(Optimization) 체제로 전환하면서 발표한 첫 라인업이 되었습니다. PAO 전략에 비춰본다면 처음으로 14nm 미세화 공정을 적용한 5세대 브로드웰이 미세화(P) 단계, DDR4 메모리 컨트롤러를 최초로 도입한 6세대 스카이레이크가 설계(A) 단계이므로, 7세대 카비레이크는 자연스럽게 최적화(O) 단계에 속합니다.

인텔 7세대 카비레이크 프로세서는 기존에 사용하던 인텔 100 시리즈(Sunrise Point) 메인보드에서도 사용할 수 있지만, 함께 출시된 3DXPoint 기반 SSD 인텔 옵테인(Optane)을 사용하려면 인텔 200 시리즈(Union Point) 메인보드와 함께 사용해야 합니다.

Intel 7th Core Processor - Presentation Slide 01

이전 세대인 스카이레이크와 차이점을 꼽자면 공정 최적화에 따라 클럭 스피드가 소폭 상승했으며, 코어 아키텍처 이후 처음으로 펜티엄 시리즈도 하이퍼 스레딩(Hyper Threading) 기술을 지원하기 시작했습니다. 이에 따라 상위 모델인 코어 i3 시리즈는 오버클럭이 가능한 K-SKUs 및 터보 부스트를 지원하는 모델이 추가되었습니다.

또한 연산성능은 비슷하지만 내장 그래픽 코어(iGPU)의 미디어 가속 능력도 여러모로 향상된 모습을 보여줍니다. H.265 및 VP9 고효율 비디오 코덱 기반의 4K / 10bit / 60-fps 영상을 하드웨어 가속 할 수 있으며, H.265 Main 8 / VP9 8bit 인코딩도 하드웨어 가속을 지원합니다. 10bit 컬러를 지원하므로 영상에 HDR 효과를 추가할 수도 있습니다.

Intel 7th Core Processor - Presentation Slide 02 Intel 7th Core Processor - Presentation Slide 03

Intel Brand Logo 6000 시리즈 코어 X 프로세서, LGA 2011 v3 (2016년 6월, Broadwell-E)
- 6000 시리즈 코어 X 프로세서, LGA 2011 v3
특수 용도에 맞춰 출시된 표준 데스크탑 시리즈와 달리, 하이엔드 데스크탑(HEDT) 기반 브로드웰-E 프로세서는 익스트림 라인업의 기조를 그대로 유지해 최대 코어수가 2개 더 늘어난 10C/20T 제품군을 보유하게 되었습니다.

하드웨어 트랜잭션 메모리(TSX)를 사용할 수 있도록 개선된 상태로 출시되었기 때문에 데이터베이스 관리 작업에서 더욱 빠른 성능을 기대할 수 있습니다. 이미 세대 교체가 이루어진 하스웰 시리즈는 마이크로코드 업데이트 이후 비활성화 되었고 브로드웰 역시 초기 스테핑 버전에서 동일한 문제가 발견되었지만, 새로운 스테핑 버전으로 정상적으로 작동하도록 수정한 제품을 선보이면서 고성능 멀티스레드 작업에서 차별화된 제품으로 자리잡았습니다.

Intel Core X 6000-series Processor - Presentation Slide 01

또한 인텔 터보 부스트 맥스 3.0 기능이 새롭게 추가되었습니다. 싱글-코어 어플리케이션을 실행할 경우 사전에 정의한 베스트 코어를 가속시켜 기존의 터보 부스트 2.0 보다 더 높은 클럭 스피드로 작동합니다. 이로써 표준 데스크탑 모델에 비해 평균적으로 낮은편이던 싱글-쓰레드 성능까지 보완할 수 있게 되었습니다.

DDR4 메모리 가격이 주력 메모리(DDR3)의 두 배에 달하던 하스웰-E 프로세서와 달리, 스카이레이크 덕분에 DDR4 메모리가 주력으로 자리잡은 상황인 브로드웰-E 기반 시스템의 가격은 좀 더 저렴할 법도 했지만 실상은 그렇지 못했습니다. 하스웰-E 프로세서에 비해 5~10% 가량 높은 가격이 책정되었기 때문입니다. 이는 동급 프로세서일 경우 대략 5~10만원 정도이며, 최초의 일반 소비자용 10-코어 프로세서인 i7-6950X Extreme Edition 모델은 8-코어 모델인 i7-6900K 모델보다 $650(65만원 이상) 가량 높은 가격이 책정되었습니다.

Intel Core X 6000-series Processor - Presentation Slide 02 Intel Core X 6000-series Processor - Presentation Slide 03

Intel Brand Logo 6세대 코어 프로세서, LGA 1151 (2015년 8월, Skylake-S)
- 6세대 코어 프로세서, LGA 1151
브로드웰(Broadwell)이 공정 개선에 따른 잠재력을 내장 그래픽 코어(iGPU)에 투자하면서 모바일 시장에 집중되었고, 하스웰 기반 데스크탑 PC를 구축한 유저들은 이를 건너뛰고 공정 + 설계 + 메모리의 세대 교체라는 삼박자를 두루 갖춘 6세대 스카이레이크 코어 프로세서로 몰려 폭발적인 인기를 얻었습니다.

하스웰 아키텍처(4세대)에서 늘린 백엔드에 이어 프론트엔드까지 보강된 스카이레이크는 성능면에서 충분히 긍정적인 요소들을 모두 갖췄습니다. 때마침 메모리 시장도 DDR3 에서 DDR4로 전환되는 시점이었기 때문에 새로운 기왕이면 새로운 시스템으로 전환하는 유저들이 많았다는 점도 스카이레이크의 수요를 늘리는데 한 몫 했습니다.

Intel 6th Core Processor - Presentation Slide 01

프로세서와 플랫폼의 경계로 보자면 통합 전압 조정기(FIVR)가 빠지게 되면서 시스템 레벨의 전력 제어권은 메인보드의 역할로 돌아갔습니다. 이는 메인보드들의 품질을 평준화시켰지만, 하이엔드 메인보드의 메리트 감소 및 발열 상승으로 오버클러킹 잠재력을 떨어뜨리던 FIVR의 제약이 사라졌다고 평가할 수 있겠습니다. 인텔의 일반 소비자용 메인보드 플랫폼은 상위 라인업인 Z-Series를 제외하면 오버클럭을 지원하지 않기 때문에 일반 소비자 입장에서는 투자한만큼 돌려받을 가능성이 늘어난 셈 입니다.

이외에도 내장 그래픽 코어의 3D 성능이 제법 향상되었습니다. 이전 세대까지는 저사양 캐주얼 게임으로 분류되던 리그 오브 레전드(LoL)를 쾌적하게 즐기려면 그래픽 옵션의 타협이 필요했지만, 스카이레이크 세대는 코어 i3 부터 풀옵션 상태에서도 쾌적한 플레이가 가능해졌습니다.

Intel 6th Core Processor - Presentation Slide 02 Intel 6th Core Processor - Presentation Slide 03

AMD Brand Logo 6세대 APU 프로세서, FM2+ (2015년 6월, Carrizo)
- 6세대 APU 프로세서, FM2+
AMD의 코드네임 중장비 로드맵의 최종 단계인 익스카베이터(Excavator) CPU 코어를 탑재한 최초의 프로세서입니다. 이전 세대인 스팀롤러에 비해 L1 캐시를 2배, 분기 목표 버퍼(BTB, Branch Target Buffer)50% 추가 확장하는 등, 꾸준히 지적되어 오던 클럭당 성능(IPC)을 높이기 위해 가장 원초적인 부분들을 개선한 라인업입니다.

특히 저전력에서 높은 성능을 낼 수 있도록 설계를 최적화시켜 울트라 모바일 수준인 15W 기준으로 39% 가량 증가한 클럭 스피드를 바탕으로 최대 55%의 성능 향상을 기록했다고 밝혔습니다. 표준 모바일(35W) 전력 환경에서 클럭 스피드 차이는 평균 5% 미만으로 별반 달라지지 않았지만, 약 9~13% 추가로 향상된 성능을 기록해 IPC 증가를 확인할 수 있었습니다.

AMD Carrizo Processor - Presentation Slide 01

또한 고밀도 라이브러리 디자인을 채택함에 따라 동일한 28nm 공정임에도 스팀롤러 대비 23%의 면적을 절약해 생산단가를 낮추는 한편, 저전력 상태에서 효율이 높아지는 공정의 특성을 살려 저가형 게이밍 노트북 시장에서 모습을 비추는 일이 늘어났습니다. 특히 모바일에서 중요한 실시간 클럭 및 전압 조절기능을 위해 AVFS 센서 모듈을 내장해 아무런 작업이 없는 대기 상태일 때 절전모드(S3) 수준의 효율을 제공하는 S0i3 기술을 주요 특징으로 내세우기도 했습니다.

CPU 코어를 개선하는데 역량을 집중한만큼 GPU 코어는 카베리와 동일하게 최대 8개(512sp)의 컴퓨트 유닛을 탑재할 수 있도록 설계되었습니다. 점유율 확보가 힘들었던 국내 데스크탑 PC 시장에는 APU 프로세서 대신 내장 GPU가 빠진 초저가 CPU 형태의 애슬론 X4 835/845 모델들만 출시되었습니다.

AMD Carrizo Processor - Presentation Slide 02 AMD Carrizo Processor - Presentation Slide 03

AMD Brand Logo 5세대 APU 프로세서, SoC (2015년 6월, Beema)
- 5세대 APU 프로세서, SoC
AMD 비마는 사실 데스크탑 프로세서가 아니라 노트북이나 태블릿 PC와 같은 저전력 모바일 시장을 목표로 출시된 제품입니다. 명목상의 목표는 경쟁사의 베이트레일과 같은 포지션으로 추측해 볼 수 있지만, 일반 소비자들을 위한 저전력 모바일 시장에서 경쟁사와 비슷한 연산 성능에 약간 더 나은 그래픽 성능만으로 절대적인 전력 소비량 차이를 극복하는 것은 어려워 보입니다.

실제로 비마의 CPU 코어인 퓨마 플러스(Puma+)는 카비니에 쓰였던 재규어 아키텍처와 근본적으로 크게 달라지지 않았습니다. 누설 전류를 줄이는 최적화가 적용되어 동일한 전력 소비량으로 좀 더 높은 클럭 스피드를 제공하며, GPU 코어는 동영상 관련 하드웨어 가속 기능인 UVD(Unified Video Decoder)VCE(Video Coding Encoder)를 최신 버전으로 탑재했다는 차이점이 있습니다.

AMD Beema Processor - Presentation Slide 01

또한 PSP(Platform Security Processor)로 불리는 보안 전용 ARM 모듈을 추가로 내장해 보안을 강화시켰습니다.

이러한 변화들은 일반 소비자용 제품군보다 임베디드 분야에서 더욱 빛을 발했습니다. 특히 디지털 사이니지(Signage) 분야에 적합한 구성으로, 누설 전류를 줄여 유지비를 절약하고 PSP를 통해 광고판 해킹과 같은 외부 위협을 차단하면서 향상된 GPU 코어로 고화질 영상 재생 능력까지 갖췄기 때문입니다.

AMD Beema Processor - Presentation Slide 02 AMD Beema Processor - Presentation Slide 03

Intel Brand Logo 5세대 코어 프로세서, LGA 1150 (2014년 9월, Broadwell)
- 5세대 코어 프로세서, LGA 1150
인텔 5세대 코어 프로세서는 지금까지의 코어 프로세서 라인업과는 조금 다른 모습으로 출시되었습니다. 최초의 14nm FinFET 공정과 eDRAM(L4) 캐시를 탑재하는 등, 새로운 공정과 함께 대대적인 개선을 거친 모델로 볼 수 있습니다.

하지만 5세대 기반 리테일 데스크탑 프로세서는 코어 i7-5770C 와 코어 i5-5675C 모델만이 2개월 남짓한 짧은 시간동안 한정적인 수량으로 풀렸습니다. 새로운 기술에도 불구하고 실질적인 연산부인 CPU 코어는 하스웰과 동일한 구조였기 때문에 연산 성능면에서는 큰 차이를 느끼기 힘들었고, 전용 그래픽 카드를 탑재하는 것이 일반적인 고사양 데스크탑 PC 시장에서 내장 GPU 코어 성능이 대폭 향상된 점을 가격 상승폭에 준하는 메리트로 꼽기에는 역부족이라고 보는 시선이 많았습니다.

Intel 5th Core Processor - Presentation Slide 01

더군다나 거의 비슷한 시기에 출시된 6세대 스카이레이크 프로세서가 CPU 코어 프론트엔드 확장 + DDR4 메모리 지원 사양으로 출시되었기 때문에, eDRAM 및 TSX 명령어를 기존 플랫폼으로 적극적으로 활용할 계획을 가진 소수의 유저들에게만 공급되고 빠르게 단종 수순을 밟았습니다.

이렇듯 데스크탑 시장에서는 반쯤 의도적으로 징검다리 역할을 수행하게 되었지만, 데스크탑 모델보다 먼저 출시되었던 초박형 노트북 시장에서는 앞서 소개한 모든 특징들이 필수적인 개선 요소로 꼽히는 시장이기 때문에 대대적인 신제품 출시와 함께 세대 교체의 주역으로 대우받았습니다. 특히 2017년 이전까지는 DDR3 메모리가 DDR4 메모리보다 가격대비 용량면에서 앞섰으며, 프로세서 자체 가격대비 성능면에서도 충분한 경쟁력을 갖춘 덕분에 꾸준한 수요를 보이기도 했습니다.

Intel 5th Core Processor - Presentation Slide 02 Intel 5th Core Processor - Presentation Slide 03

Intel Brand Logo 5000 시리즈 코어 X 프로세서, LGA 2011 v3 (2014년 9월, Haswell-E)
- 5000 시리즈 코어 X 프로세서, LGA 2011 v3
하스웰 코어 설계를 바탕으로 출시된 하이엔드 데스크탑 프로세서입니다. 일반 소비자용 제품 중 최초로 DDR4 메모리를 지원함으로써 하이엔드라는 라인업의 명칭에 걸맞게 차세대 고사양 컴퓨팅의 지평을 열었다고 볼 수 있겠습니다.

지난 2/3세대 HEDT 프로세서 시리즈의 전환이 사실상 공정 전환 정도로 끝난 것이 아쉬웠는지, 이번 세대 교체에서는 라인업 내 모든 제품군의 코어를 2개씩 증가시켜 하이엔드의 이름에 걸맞는 변화를 꾀했습니다.

Intel Core X 5000-series Processor - Presentation Slide 01

이렇듯 많은 변화가 있었던만큼 칩셋은 물론이고, 장착하는 소켓까지 전부 새롭게 바뀌었습니다.

특히 LGA2011-3 소켓의 경우 설계 규격대로의 정상 작동에 필수적인 핀 개수는 2011개지만, CPU 상에 예비로 남겨둔 접점등을 포함하면 총 2102개의 핀을 사용할 수 있습니다. 일부 메인보드 제조사들은 예비 핀의 일부 또는 전부를 포함시켜 오버클럭에 도움이 될만한 요소를 추가해 OC Socket 등의 명칭으로 제공하기도 합니다.

Intel Core X 5000-series Processor - Presentation Slide 02 Intel Core X 5000-series Processor - Presentation Slide 03

AMD Brand Logo 4세대 APU 프로세서, FM2+ (2014년 1월, Kaveri)
- 4세대 APU 프로세서, FM2+
4세대 APU 프로세서인 카베리는 AMD가 오랫동안 그려왔던 이기종 시스템 설계(HSA, Heterogeneous System Architecture)를 마침내 완벽하게 재현해 낸 프로세서라고 볼 수 있습니다.

마침내 GCN 기반의 GPU 코어와 스팀롤러 기반의 CPU 코어를 이어주는 직결 인터페이스가 새롭게 추가되었기 때문입니다. 구조적인 부분을 떠나 CPU 코어와 GPU 코어 각각의 변화도 혁신이라고 칭할만큼 크게 바뀌었습니다.

AMD Kaveri Processor - Presentation Slide 01

개선된 CPU 코어인 스팀롤러(Steamroller)는 이전 세대인 불도저나 파일드라이버 기반 아키텍처에서 사용되던 1개의 공유 명령어 디코더 유닛을 2개의 개별 유닛으로 분산 배치해 병목현상을 해소하는 한편, 분기 예측 강화로 캐시 미스를 줄여 가장 큰 문제인 코어당 성능(IPC)을 10-20% 가량 향상시키는데 성공했습니다.

GPU 코어는 최신 그래픽 카드인 라데온 R9 290X(Hawaii) 기반의 GCN 컴퓨트 유닛을 최대 8개(512sp)까지 탑재할 수 있도록 디자인 되었습니다. 테라스케일(VLIW) 기반의 이전 세대 APU들에 비해 차세대 범용 GPU 명령어(OpenCL 등)를 활용해 더 쉽고 강력한 성능으로 만들어줍니다.

AMD Kaveri Processor - Presentation Slide 02 AMD Kaveri Processor - Presentation Slide 03

Intel Brand Logo 4000 시리즈 코어 X 프로세서, LGA 2011 (2013년 9월, Ivy Bridge-E)
- 4000 시리즈 코어 X 프로세서, LGA 2011
(Tick)에 속하는 3세대 코어 시리즈의 기술을 활용하여 설계된 하이엔드 데스크탑(HEDT) 프로세서로 코어 개수나 DDR3 메모리 지원은 이전 세대인 샌디 브릿지-E와 동일합니다.

대신 더욱 미세해진 22nm 공정이 적용되어 클럭 스피드가 상승했으며, 미세 공정으로 늘어난 클럭 여유폭을 십분 활용해 배수(Ratio) 조절을 최대 63x 까지 설정할 수 있습니다. 물론 어디까지나 설정이 가능할 뿐이고 정상작동 수치를 찾는 일은 오버클러커의 역할입니다.

Intel Core X 4000-series Processor - Presentation Slide 01

또한 PCI-Express 3.0 인터페이스를 지원해 장치(특히 그래픽 카드) 간 대역폭이 두 배로 상승했습니다.

짝을 이루는 메인보드 칩셋은 샌디 브릿지-E와 동일한 X79이지만, 프로세서와 직결된 슬롯은 PCI-Express 3.0 규격으로 동작합니다. 단, 칩셋간 인터페이스는 여전히 DMI 2.0을 사용하기 때문에 X79 칩셋과 연결된 슬롯은 여전히 PCI-Express 2.0 규격으로 동작합니다.

Intel Core X 4000-series Processor - Presentation Slide 02 Intel Core X 4000-series Processor - Presentation Slide 03

Intel Brand Logo 4세대 코어 프로세서, LGA 1150 (2013년 6월, Haswell)
- 4세대 코어 프로세서, LGA 1150
인텔의 틱-톡(Tick-Tock) 전략 중 톡에 속하는 단계로 프로세서의 설계를 개선해 근본적인 성능 향상이 이루어진 라인업입니다.

실제로 백엔드 단의 L1 캐시의 대역폭이 두 배로 늘어나고, L2 캐시도 두 배로 확장되어 클럭당 성능(IPC) 향상을 기대할 수 있습니다.

Intel 4th Core Processor - Presentation Slide 01

프로세서에 내장되는 통합 전압 조정기(FIVR)를 채택해 클럭 변동에 따른 전압 조절을 더 정밀하고 빠르게 제어할 수 있게 되었습니다. 메인보드의 경우 저가형 제품의 전력 설계에 별다른 노력을 들일 필요가 없어졌지만, 고가의 메인보드에서 제공하던 고급 전력 제어기능도 유명무실해지는 현상이 부각되기도 했습니다.

2014년에는 후속 공정인 14nm 생산이 연기되어 클럭 스피드를 좀 더 높인 하스웰-리프레시와 데빌스 캐년(Devil's Canyon) 라인업을 출시했습니다. 인텔의 프로세서 역사상 최초로 베이스 클럭 4.0GHz로 작동하는 코어 i7-4790K와 펜티엄 브랜드가 20주년을 맞이한 기념으로 유일한 오버클럭 지원 모델인 펜티엄 G3258이 함께 출시되었습니다.

Intel 4th Core Processor - Presentation Slide 02 Intel 4th Core Processor - Presentation Slide 03

AMD Brand Logo 3세대 APU 프로세서, AM1 (2013년 5월, Kabini)
- 3세대 APU 프로세서, AM1
소형 폼팩터 기기에 요구되는 저전력/저발열을 추구한 설계로 재규어(Jaguar) 마이크로 아키텍처와 보네어(Bonaire) 세대의 GCN 컴퓨트 유닛 2개(128sp)를 탑재한 모델입니다.

CPU 코어인 재규어는 최신 게임콘솔인 PS4 와 Xbox One 에 탑재된 것으로 유명합니다. 비록 데스크탑 PC 시장에서는 기를 못펴고 있지만 넷북/넷탑 및 임베디드 시장에서 호평을 받았던 밥캣(Bobcat) 코어에서 한층 더 진보한 설계로, 단일코어 위주로 설계뙨 밥캣이 듀얼코어에 머무른 것과 달리 재규어는 처음부터 쿼드코어 기반으로 설계되었기 때문에 다중작업이나 멀티쓰레드 작업에 더 유리해졌습니다.

AMD Kabini Processor - Presentation Slide 01

또한 AMD가 제공할 수 있는 메리트 중 하나인 GPU 코어는 라데온 R7 260과 동등한 기술 구현이 가능한 GCN 설계에 기반하고 있습니다. 통합 비디오 디코더(UVD)를 내장하고 있어 코덱에 따라 4K UHD 영상도 끊김없이 재생할 수 있고, 가벼운 3D 그래픽 구현에도 경쟁사에 비해 더 나은 품질과 성능을 제공합니다. 이러한 장점들은 어린이를 위한 가벼운 캐주얼 게임부터 가정용 홈시어터(HTPC) 플랫폼으로 활용하기에 충분한 매력이 될 수 있습니다.

마지막으로 카비니는 시스템 온 칩(SoC) 구조로 CPU 와 GPU 코어는 물론이고 SATA 나 USB 포트와 같은 입출력 칩셋 기능까지 프로세서에 통합되어 있습니다. 따라서 메인보드에 브릿지 칩셋을 장착할 필요가 없어 성능, 전력, 면적 등 여러 측면에서 소형 폼팩터에 최적화된 구성을 갖췄다고 평가할 수 있겠습니다.

AMD Kabini Processor - Presentation Slide 02 AMD Kabini Processor - Presentation Slide 03

AMD Brand Logo 2세대 FX 프로세서, AM3+ (2012년 10월, Vishera)
- 2세대 FX 프로세서, AM3+
불도저(Bulldozer) 기반의 1세대 FX 시리즈에서 불거진 문제들을 일부 수습하여 출시된 프로세서입니다. 분기예측 실패와 캐시 미스로 인한 성능 하락을 보상하기 위해 명령어 투입 준비(Prefetch) / 스케줄링(Decode) 단계를 개선하고 캐시 메모리의 효율을 높이는 한편, 사이클로스(Cyclos)社의 공진 클럭 메시(Resonant Clock Mesh)와 터보 코어 3.0 기술을 도입해 클럭 스피드를 끌어올려 부진했던 클럭당 성능(IPC) 향상을 꾀했습니다.

위와 같은 변화를 통해 이전 세대 아키텍처보다 떨어지는 성능은 만회했지만, 경쟁사 제품과 성능 격차는 여전했기 때문에 비판을 피해갈 수 없었습니다. 특히 클럭을 향상시켜 성능을 만회할 수 있도록 개방한 오버클럭(Unlocked) 정책은 함께 제공되는 정품 쿨러로는 발열을 감당하지 못하거나 소음이 급격하게 증가하는 문제로 몸살을 앓았고, 덩달아 상승한 전력 소비량 역시 감당하지 못하는 메인보드들이 발견되어 가격적인 메리트가 희석되는 경향을 보였습니다.

AMD Vishera Processor - Presentation Slide 01

이후 AMD는 오랫동안 중장비 코드명을 갖는 프로세서의 고성능화를 잠정 중단하고, 차기 아키텍처가 완성될 때까지 고효율 저전력화를 통한 메인스트림 프로세서 개발 및 주문제작형 SoC 설계에 주력하는 방향으로 전환했습니다.

2017년 후속 마이크로 아키텍처인 젠(Zen) 코어가 출시되면서 시장을 넘겨주게 되었는데, 아이러니하게도 출시되었을 당시에는 빛을 보지 못했던 모듈식 멀티코어가 충분히 활용될 수 있는 방향으로 소프트웨어 시장의 발전이 이루어져 뒤늦게 경쟁력을 갖춘 가격대비 성능으로 재평가되기도 했습니다.

AMD Vishera Processor - Presentation Slide 02 AMD Vishera Processor - Presentation Slide 03

AMD Brand Logo 2세대 APU 프로세서, FM2 (2012년 5월, Trinity)
- 2세대 APU 프로세서, FM2
트리니티는 성공적으로 안착한 APU 프로세서 라노를 잇는 라인업으로 파일드라이버 기반 CPU 코어와 3세대 테라스케일 GPU 코어를 통합했습니다. 단순히 CPU와 GPU를 하나의 실리콘 다이에 통합하는 것을 목표로 했던 라노와 달리 트리니티부터 2세대 IOMMU 로직이 도입되어 페이지 폴트(Page Fault) 발생시 가상 메모리에서 실제 메모리로 주소를 옮기는 작업을 운영체제가 아닌 하드웨어 레벨에서 실행합니다.

트리니티에 사용된 파일드라이버(Piledriver) CPU 코어는 라노에 적용되었던 스타즈(Stars) 코어는 물론이고, 현행 아키텍처의 원형인 불도저(Bulldozer)에서도 한 차례 개선되어 상대적으로 저전력 멀티 프로세싱을 구현했습니다.

AMD Trinity Processor - Presentation Slide 01

3세대 테라스케일 GPU 코어 역시 라노의 2세대 테라스케일에 비해 효율성을 강화시킨 구성으로 더 작은 실리콘 다이로도 동급의 성능을 낼 수 있도록 개발된 모델입니다. 덕분에 트리니티는 라노에 비해 64개 더 많은 스트림 프로세서(SP)를 내장할 수 있게 되었습니다.

고효율 아키텍처 설계에 따라 AMD는 트리니티는 1세대 APU에 비해 전력당 성능비가 최대 2배까지 향상되었다고 주장했습니다. 특히 지금까지 AMD 라인업에 존재하지 않던 17W 급의 초저전력 모델이 추가되는 등, 기존의 저가형 데스크탑 시장 확보에 이어서 노트북 시장에서도 가격대 성능비를 위시한 전략을 펼칠 것으로 보입니다.

AMD Trinity Processor - Presentation Slide 02 AMD Trinity Processor - Presentation Slide 03

Intel Brand Logo 3세대 코어 프로세서, LGA 1155 (2012년 4월, Ivy Bridge)
- 3세대 코어 프로세서, LGA 1155
인텔의 틱(Tick) 전략을 베이스로 설계되었으며, 최초의 22nm 3D Tri-Gate 미세 공정이 적용된 프로세서입니다.

새로운 미세공정 도입에 집중하는 틱 전략의 특성상 실질적인 연산부인 CPU 코어는 샌디브릿지와 동일하지만, 그 밖에 성능과 관련이 있는 언코어 영역(메모리 및 입출력 인터페이스)에서 많은 개선이 있었습니다.

Intel 3rd Core Processor - Presentation Slide 01

프로세서 레벨에서는 대역폭이 두 배로 늘어난 PCI-Express 3.0 인터페이스가 최초로 적용되기 시작했으며, 짝을 맞춰 출시된 인텔 7-시리즈 칩셋 플랫폼도 마찬가지로 대역폭을 늘린 SATA3 인터페이스(6Gb/s)가 최초로 적용되었습니다.

공정 전환으로 발열이나 전력에서 이점이 있을 것으로 기대되었지만, 히트-스프레더와 코어 사이의 열 전달 물질이 TIM(Thermal Interface Material)으로 변경되면서 데스크탑 시장에서는 온도 측면에서는 부정적인 시선이 많습니다. 모바일 프로세서는 실리콘 다이가 노출된 형태로 출고되기 때문에 샌디브릿지에 비해 여러 측면에서 개선되었다는 평가를 받았습니다.

Intel 3rd Core Processor - Presentation Slide 02 Intel 3rd Core Processor - Presentation Slide 03

Intel Brand Logo 3000 시리즈 코어 X 프로세서, LGA 2011 (2011년 11월, Sandy Bridge-E)
- 3000 시리즈 코어 X 프로세서, LGA 2011
서버용 제품군인 샌디 브릿지-EP 마이크로 아키텍처를 일부 수정해 익스트림급 데스크탑 프로세서로 출시한 라인업입니다.

실리콘 다이는 원본인 8-코어 디자인을 그대로 사용하지만 당시 가정용 데스크탑 PC의 열설계전력(TDP)을 고려해 최상위 모델도 2개의 코어 및 5MB 공유 캐시(L3)가 비활성화 되었습니다.

Intel Core X 3000-series Processor - Presentation Slide 01

코어 및 공유 캐시 활성화 정도에 따라 4-코어 10MB 공유 캐시(i7-3820)와 6-코어 12MB 공유 캐시(i7-3930K), 6-코어 15MB 공유 캐시(i7-3960X)로 총 3개 모델이 출시되었습니다.

최대 3-채널 메모리를 지원하던 네할렘 & 웨스트미어 기반의 일반 소비자용 1세대 코어 아키텍처에서 더 나아가 4-채널 메모리를 지원해 더욱 넓어진 대역폭을 갖추게 되었습니다. 메모리 대역폭 자체는 일반적인 컴퓨팅 성능에 큰 영향을 미치지 않지만, 더 많은 메모리를 장착할 수 있어 쾌적한 성능을 자랑하는 PC 구축이 가능해졌습니다.

Intel Core X 3000-series Processor - Presentation Slide 02 Intel Core X 3000-series Processor - Presentation Slide 03

AMD Brand Logo 1세대 FX 프로세서, AM3+ (2011년 10월, Zambezi)
- 1세대 FX 프로세서, AM3+
최초로 일반 소비자용 데스크탑 시장에 출시된 8-코어(4-모듈) 프로세서이며 클러스터 멀티 쓰레딩(CMT) 방식으로 동작합니다.

경쟁사가 일찍이 도입한 동시 멀티 쓰레딩(SMT)은 하나의 연산기에 두 개의 쓰레드를 할당하는 방식이지만, AMD의 클러스터 멀티 쓰레딩은 하나의 모듈에 두 개의 정수 연산기(Integer)가 부동 소수점 연산기(Floating Point)를 공유해 강력한 싱글-쓰레드와 효율적인 멀티-쓰레드 성능을 추구한 방식입니다.

AMD Zambezi Processor - Presentation Slide 01

그러나 실상은 공유 부동 소수점 연산기가 처리량에 따라 유연하게 분배되는 방식이 아니라, 엄격하게 정의된 사이클마다 분배가 이루어지기 때문에 쓰레드 하나 당 절반의 자원밖에 활용할 수 없어 성능이 크게 떨어지는 것으로 나타났습니다. 특히 멀티-코어 프로세서를 사용하는 이유가 멀티-쓰레드 어플리케이션의 성능 향상보다 다수의 싱글-쓰레드 프로그램을 실행시키더라도 여유로운 프로세서 자원으로 쾌적한 멀티 태스킹을 할 수 있다는 점이 더 주요한 시기였기 때문에 AMD의 예상을 웃도는 문제로 떠올랐습니다.

결과적으로 잠베지는 멀티-쓰레드를 제대로 활용하지 않는 대다수 어플리케이션에서 라이벌로 여겼던 샌디 브릿지는 커녕, 이전 세대인 스타즈 마이크로 아키텍처보다 클럭당 성능(IPC)이 떨어지는 웃지못할 성적표를 받아들어야 했습니다.

AMD Zambezi Processor - Presentation Slide 02 AMD Zambezi Processor - Presentation Slide 03

AMD Brand Logo 1세대 APU 프로세서, FM1 (2011년 6월, Llano)
- 1세대 APU 프로세서, FM1
CPU 코어 메이커인 AMD가 라데온(Radeon) GPU 코어 메이커 ATi를 인수한 뒤 처음으로 내놓은 CPU + GPU 통합 프로세서입니다. 가속 처리 장치(APU, Accelerated Processing Unit)라는 명칭을 사용했습니다.

AMD가 꿈꾸는 이상적인 APU를 향한 첫 단계로 CPU 코어와 GPU 코어가 하나의 실리콘 다이에 통합되었으며, 내부적으로 Fusion Compute Link(Onion)와 Radeon Memory Bus(Garlic)로 명명된 전용 인터페이스로 연결되었다는 점에서 의의를 갖는 제품입니다.

AMD Llano Processor - Presentation Slide 01

CPU 코어는 1세대 FX 시리즈에 사용된 불도저가 아닌 페넘 II 시리즈의 스타즈(Stars) 마이크로 아키텍처의 공정 미세화 버전이 적용되었고, GPU 코어는 라데온 HD 5000 시리즈에 사용된 2세대 테라스케일(Terascale) 아키텍처가 사용되었습니다. 두 아키텍처 모두 최신 사양은 아니지만, 나름대로 출중한 가격대 성능비로 인기를 얻었던 모델들이었기 때문에 라노 역시 호평을 받았습니다.

특히 비슷한 형태(CPU+GPU)의 경쟁사 프로세서에 비해 CPU 성능은 조금 부족하지만 GPU 성능이 압도적으로 뛰어났고, 가격 또한 상당히 저렴했기 때문에 전용 그래픽 카드 추가가 힘든 저가형 PC 견적으로 많이 채택되었습니다.

AMD Llano Processor - Presentation Slide 02 AMD Llano Processor - Presentation Slide 03

Intel Brand Logo 2세대 코어 프로세서, LGA 1155 (2011년 1월, Sandy Bridge)
- 2세대 코어 프로세서, LGA 1155
1세대 하이엔드 데스크탑 코어 프로세서에 적용되었던 링 버스 구조가 일반 소비자용 아키텍처에도 도입되었습니다. 덕분에 CPU 코어, GPU 코어, 시스템 버스(System Agent)가 고속의 캐시(L3/LLC, Last Level Cache)를 통해 데이터를 공유할 수 있게 되어 체감할만한 성능 향상을 기대해 볼 수 있게 되었습니다.

아키텍처 측면 외에도 새로운 확장 명령어 세트나 부가 기능 개선을 통해 성능 향상을 꾀했습니다. 고급 벡터 확장(AVX, Advanced Vector eXtension)은 x86 프로세서의 극적인 성능 향상을 가능케했던 MMX와 SSE의 뒤를 잇는 확장 명령어 세트로, 기존의 128-bit/2-OPrd(SSE)에서 256-bit/3-OPrd로 개선되어 약 2.5배에 달하는 성능을 낼 수 있습니다.

Intel 2nd Core Processor - Presentation Slide 01

인텔 터보 부스트 기능도 2세대로 진화하면서 좀 더 적극적으로 성능을 높일 수 있도록 개선되었습니다.

터보 부스트 1.0은 열설계전력(TDP)을 비교적 엄격하게 지켰기 때문에 클럭 상승폭이나 유지 시간이 여유롭지 않았지만, 터보 부스트 2.0부터는 안전한 시간 내에서 TDP를 넘는 클럭 스피드를 유지한 뒤 안정 상태로 복귀하도록 바뀌었습니다. IDF에서 공개한 자료에 의하면 약 25초 가량 TDP 초과 상태를 안전하게 유지할 수 있다고 합니다.

Intel 2nd Core Processor - Presentation Slide 02 Intel 2nd Core Processor - Presentation Slide 03

Intel Brand Logo 1세대 32nm 코어 프로세서, LGA 1156/1366 (2010년 1월, Westmere)
- 1세대 32nm 코어 프로세서, LGA 1156/1366
네할렘 아키텍처를 바탕으로 한 32nm 공정 미세화 버전입니다. 네할렘 기반 아키텍처가 최상위/중급형 모델 위주로 개발되었다면, 웨스트미어는 최상위/보급형으로 위주로 개발되었습니다. LAG1366 기반의 최상위 모델의 경우 걸프타운(Gulftown)이라는 코드명으로 개발되었으며 업계 최초의 6C/12T 프로세서로 출시되었습니다.

한편, LGA1156 기반의 보급형 모델은 클락데일(Clarkdale)이라는 코드명으로 듀얼-코어 CPU와 GPU가 통합된 형태로 출시되었습니다. CPU 코어는 32nm 공정이지만 메모리 컨트롤러와 GPU 코어는 45nm 공정으로 생산되어 별도의 실리콘 다이를 갖췄으며, 이를 하나의 PCB 기판에 멀티 칩 모듈(MCM) 방식으로 얹은 형태입니다.

Intel 1st Core Processor (32nm) - Presentation Slide 01

메모리 컨트롤러가 외부 인터페이스로 연결되어 실질적인 성능은 감소했기 때문에 코어i5/i3 이하의 보급형 모델로 출시되었습니다.

기존의 린필드 제품군과 겹치는 구간인 인텔 코어 i5 프로세서 시리즈의 경우 린필드 기반 4C/4T 제품군은 코어 i5-700, 클락데일 기반 2C/4T 제품군은 코어 i5-600으로 나뉘어 어렵지 않게 구분할 수 있도록 구성되었습니다.

Intel 1st Core Processor (32nm) - Presentation Slide 02 Intel 1st Core Processor (32nm) - Presentation Slide 03

Intel Brand Logo 1세대 45nm 코어 프로세서, LGA 1366/1156 (2008년 11월, Nehalem)
- 1세대 45nm 코어 프로세서, LGA 1366/1156
하이엔드 데스크탑 PC 시장의 본격적인 포문을 연 제품입니다. 초기에 출시된 LGA1366 소켓은 코드명 블룸필드(Bloomfield) 기반으로 4C/8T, 3-채널 DDR3 메모리, 퀵 패스 인터커넥트(QPI, Quick Path Interconnect) 시스템 버스 등 획기적으로 고성능 PC 시장을 한차례 휩쓸었습니다.

다만 각종 신기술들과 높은 성능에 준하는 가격적인 부담도 제법 큰 편이라 중~보급형 시장에서는 여전히 이전 세대 프로세서인 켄츠필드나 요크필드를 유지하는 모습도 어렵지 않게 볼 수 있었습니다.

Intel 1st Core Processor (45nm) - Presentation Slide 01

시간이 조금 흐른 뒤에는 중급형 시장을 위해 LGA1156 소켓과 함께 린필드(Lynnfield) 시리즈를 출시했습니다. LGA1366에 비하면 메모리 컨트롤러의 성능이 조금 축소되어 2-채널만 지원하며, DDR3 메모리 공식 지원 대역폭도 소폭 낮아졌습니다.

또한 프로세서와 칩셋간의 연결 방식도 QPI 대신 기존의 다이렉트 미디어 인터페이스(DMI, Direct Media Interface)를 채택했습니다. 그럼에도 불구하고 프로세서 성능 자체는 블룸필드에 필적했기 때문에 상당한 인기를 누렸습니다.

Intel 1st Core Processor (45nm) - Presentation Slide 02 Intel 1st Core Processor (45nm) - Presentation Slide 03