[IT·HW.SW사용법]/최근·최신 IT정보

새로운 펜린 CPU리뷰

기쁨조미료25 2007. 11. 24. 00:49
새로운 펜린 CPU리뷰
인텔, 최초 45nm 펜린 계열 칩 출시 ①
펜린
Intel
인텔이 10월29일 펜린 계열 프로세서들을 최초로 공개했다. 이어 이달 12일(미국시간) 기존 QX6850을 대체하는 코드명 요크필드(Yorkfield)의 ‘인텔 코어 2 익스트림 QX9650’ 쿼드코어 프로세서를 전격 출시했다. 신규 QX9650 프로세서는 3GHz의 속도로 실행되며 12MB(메가바이트)의 L2 캐시가 내장됐다.

펜린 아키텍처는 인텔의 기존 코어 기술의 한 단계 진전으로 평할 수 있다. 신규 QX9650 쿼드코어 칩이 고성능 데스크톱 제품에 탑재되는 시기는 이번 분기 말쯤이 될 것으로 전망된다.

한편 이에 대응하는 서버용 쿼드코어 칩은 코드명 하퍼타운(Harpertown)의 펜린 프로세서이다. 이전 세대인 코어2 프로세서 계열이 65nm(나노미터) 공정에서 제조된 것과 달리 펜린 계열은 45nm 공정에서 제조된다.

코드명 울프데일(Wolfdale)의 듀얼코어 펜린 프로세서에는 6MB의 L2 캐시(2 x 3MB)가 내장됐다. 쿼드코어 칩인 하퍼타운과 요크필드는 2개의 울프데일을 패키지화한 제품이기 때문에 L2 캐시 용량은 12MB가 된다. 펜린 마이크로아키텍처는 기존보다 향상된 작업 수행 능력을 제공하며 새롭게 SSE4 명령어 셋을 채택했다.

47개의 신규 SSE4 명령어는 동영상 압축 등 주로 멀티미디어 성능 향상과 연관되어 있다. 인텔은 서버 및 데스크톱의 쿼드코어 펜린 프로세서는 출시했지만 노트북의 경우에는 적어도 당분간은 현행 듀얼코어 체제를 유지할 방침인 것으로 알려졌다.

아울러 12일(미국시간) 펜린 계열 신제품이 추가적으로 발표된다. 이들 칩은 내년 초쯤에 시장에 보편화될 것으로 전망된다.


인텔 최초의 45nm 펜린 계열 프로세서(아래 표 참조)인 코드명 요크필드의 데스크톱용 프로세서는 12MB의 L2 캐시 용량에 3GHZ 속도로 실행되는 쿼드코어 프로세서이다.

인텔의 45nm 펜린 프로세서

테스트 환경 및 전력 소모
‘코어 2 익스트림 QX9650’은 1,333MHz의 프론트사이드 버스(FSB) 속도를 지원하며 인텔 X38 칩셋 기반 ‘소켓 775 메인보드’에 적용될 수 있다. 이는 1,333MHz FSB를 지원하는 다른 대부분의 소켓 775 메인보드와도 호환되지만 제조업체에 따라 그렇지 않을 수도 있다. 이보다 구형의 보드라면 바이오스 업데이트가 필수다.

테스트 구성 환경
12MB의 L2 캐시가 내장된 45nm QX9650 쿼드코어 칩의 성능을 평가하기 위해 이를 인텔의 기존 최고 성능 데스크톱 칩인 8MB의 L2 캐시가 내장된 65nm QX6850 쿼드코어 칩과 비교 테스트를 시행했다.

양 칩의 클럭 속도 및 데이터 전송 인터페이스 속도(FSB)는 각각 3GHz 및 1,333MHz로 서로 동일하다. 따라서 이들의 벤치마크 결과를 보면 프로세서 성능에 대한 상대적이 아닌 절대적 비교가 가능할 것이다.

인텔의 고성능 익스트림 프로세서에서는 오버클럭이 허용된다. 그래서 3.3GHz로 클럭 속도를 높인 신규 칩도 테스트에 포함시키기로 했다. 아울러 1MB의 L2 캐시가 내장된 3GHz 펜티엄 4 프로세서도 테스트에 추가했다. 3년 전 출시된 90nm 프레스캇 프로세서는 단일 코어지만 하이퍼쓰레딩(Hyperthreading)을 지원한다.

신규 칩은 DDR3 메모리 역시 지원한다. 따라서 DDR2 메모리 기술과의 성능 차이 역시 비교해볼 예정이다.

전력 소모
45nm 제조 공정이 주는 장점 중 하나는 바로 낮은 전력 소모량이다. 신규 45nm 프로세서는 대기모드에서 불과 190W의 전력만을 소비함으로써 65nm 프로세서의 227W에 비해 전력소모량이 현저히 낮아졌다.

최대 실행 모드에서 이 차이는 더욱 심화되는데 65nm QX6850의 전력 소비량은 337W인 데 반해 QX8650은 264W에 불과하다. 이를 3GHz 펜티엄4와 비교해보아도 놀라운데 펜티엄4는 대기모드에서 210W, 최대실행모드에서 277W의 전력을 사용함으로써 신규 칩보다 오히려 전력소모가 더 많은 것으로 나타났다. @


전력 소모량 테스트에 이용된 시스템의 규격



인텔, 최초 45nm 펜린 계열 칩 출시 ②

Kai Schmerer ( ZDNet UK )   2007/11/14
펜린
Intel
메모리
메모리 테스트에서는 프로세서와 메모리간 데이터 송수신 속도가 어느 정도인지 파악할 수 있게 해준다. 단순한 쓰루풋(throught: 데이터 처리량)뿐만 아니라 메모리 셀에 도달하기까지 걸리는 시간 역시 중요하다.

메모리 셀에 액세스하는 데 요구되는 CPU 클럭 사이클이 적을수록 데이터를 읽는 속도는 더 빨라진다. 데이터베이스의 경우 낮은 대기시간은 특히 중요한 요소이다.

1,333MHz DDR3 메모리가 채택된 ‘코어 2 익스트림 QX9650’ 시스템에서 가장 높은 쓰루풋과 가장 낮은 대기시간을 보인 것으로 나타났다. 펜티엄4는 800MHz에 불과한 FSB로 인해 신규 1,333MHz FSB 프로세서의 성능을 따라가기에는 역부족이었다. 256 및 512바이트 메모리 블록 액세스 시의 대기시간이 특히 높게 나타났다.




VM웨어 6.0: 가상화
가상화는 기업 환경에서 날로 각광받고 있는 기술이다. VM웨어 워크스테이션 6와 애플리케이션 벤치마크 툴인 윈스톤 스위트(Winstone suite)를 이용해 가상화 IT 환경에서의 테스트를 시행했다.

이 테스트에서 윈스톤이 다소 오래된 테스트 툴이라는 것은 전혀 문제가 되지 않는다. 애플리케이션 성능이 아니라 VM웨어 가상화시 프로세서의 처리 능력을 알고자 하는 것이기 때문이다.

가상 머신(VM) 운영 시 쿼드코어 칩들은 기존 펜티엄4 프로세서에 비해 명백한 성능 우위를 나타냈다. 첫 번째 테스트에서 윈도우XP를 기반으로 한 2대의 VM이 시작되고 이를 기반으로 콘텐츠 크리에이션 윈스톤(CCWS) 벤치마크 스위트를 실행한다. 쿼드코어라면 2대의 VM에 각각 2개의 CPU 코어를 할당할 수 있을 것이다.

이 같은 더할 나위 없는 적합성에 의해 쿼드코어 칩들은 단일 코어 칩에 비해 월등한 성능 우위를 점할 수 있었다. 테스트에서 가장 빠른 시스템인 클럭 속도 3.33GHz의 QX9650 시스템은 단일코어3GHz 펜티엄4 시스템에 비해 5배 가까운 속도 차이를 나타냈다.

CPU 리소스 소모가 많은 이미지 처리 소프트웨어인 페인트넷(Paint Net)을 이용한 두 번째 테스트에서도 오버클럭이 적용된 위 쿼드코어 시스템은 단일 코어 시스템에 비해 7배나 빠른 처리속도를 나타냈다.




이미지 편집
이미지 편집 애플리케이션 실행 시 성능을 평가하기 위해 인기 프로그램인 ‘파노라마 팩토리(Panorama Factory)’와 무료 툴인 ‘페인트 넷(Paint.Net)’과 함께 자바 기반의 ‘J앨범(Jalbum)’을 이용해 테스트를 시행했다.

이 테스트는 단일 코어에 대한 쿼드코어 프로세서의 우수성이 극명히 드러난 테스트였다고 말할 수 있을 정도였다. 페인트넷을 이용한 실험에서 3GHz 쿼드코어 시스템에서는 단 21.3초가 걸린 작업이 펜티엄4 시스템에서는 무려 136.7초나 걸렸다. 한편 파노라마 팩토리를 이용한 실험에서 45nm QX9650와 65nm QX6850의 성능은 대동소이했다.

비디오 및 사운드 편집
비디오 및 사운드 편집 테스트는 동영상 파일을 아이팟 포맷으로 변환한다거나 핑크 플로이드의 ‘Dark Side of the Moon ‘이 담긴 450MB WAV 파일로부터 320Kbps의 MP3 파일을 생성하는 식으로 진행됐다.

버추얼더브(VirtualDub)는 신규 쿼드코어 칩 내 SSE4 명령어에 최적화된 DivX6.7 포맷 동영상을 생성할 수 있는 현재까지 유일한 소프트웨어이다. 따라서 QX9650은 이와 관련한 테스트에서 QX6850보다 34%정도의 성능우위를 보여주었다. 나머지 테스트에서 이들은 거의 동일한 성능을 보여주었다. @
인텔, 최초 45nm 펜린 계열 칩 출시 ③

Kai Schmerer ( ZDNet UK )   2007/11/14  
펜린
Intel
랜더링
3D 렌더링 소프트웨어에서는 멀티 코어 CPU의 진가가 여실히 드러난다. 쿼드코어 칩들은 단일 코어 펜티엄4에 비해 최대 7배나 높은 성능을 나타냈다. 45nm QX9650은 늘어난 캐시 용량을 바탕으로 시네마4D를 이용한 테스트에서 65nm QX6850에 비해 8% 정도의 향상된 렌더링 성능을 보여주었다.



3D 게임
3D 게임에 의한 실험에서만큼은 쿼드코어 프로세서의 진가가 제대로 발휘되지 못했다. 최신의 ‘3D마크 06’ 기술이 가진 이론상의 여러 장점들이 그래픽 카드로 인해 제대로 발휘되지 못했기 때문이다.

‘F.E.A.R’ 및 ‘Call of Juarez’를 대상으로 한 실험에서 단일 코어 펜티엄4 시스템의 성능은 쿼드코어 프로세서에 비해 약간의 차이밖에 나타내지 않았다. 테스트를 통틀어 펜티엄4가 쿼드코어 칩과의 비교에서 가장 근접한 성능을 보인 사례였다.



결론
‘인텔 코어 2 익스트림 QX9650’은 999달러라는 높은 가격에 걸맞은 성능을 지니고 있다. 이 칩은 이미지, 비디오 및 사운드 편집 분야에서 탁월한 성능을 보여주었고 3D 렌더링 소프트웨어나 가상 머신에서도 그 진가를 유감없이 발휘했다.

여기까지의 벤치마크 자료를 보면 최신 소프트웨어를 이용하는 경우 쿼드코어 칩과 단일 코어 프로세서간 성능 차이가 확연히 드러나는 것을 알 수 있다. 일부 테스트에서 쿼드코어 칩들은 동일 클럭의 펜티엄4에 비해 7배나 빠른 속도를 보여주기도 했다.

3D 게임에서라면 쿼드코어 프로세서를 채택하는 일이 아직은 시기상조일지 모른다. 하지만 향후 쿼드코어로의 최적화가 진행되는 경우 상황은 급변할 것이다. 간단히 말해 프로그램의 병렬화가 심화될수록 - 즉 쓰레드가 늘어날수록 - 쿼드코어의 진가가 유감없이 발휘될 수 있게 될 것이다.

CPU의 성능에 늘 목말라하는 사람이라면 익스트림 시리즈에서 오버클럭을 허용한다는 것도 희소식일 것이다. QX9650은 벤치마크 결과에서 보듯 3.33GHz에서 아무런 문제없이 작동했다. 그러나 3.66GHz에서라면 안정적 시스템 운영을 위해 파워서플라이나 쿨러 계통에 신경을 좀 써야 할 것이다.

65nm QX6850에 비해 45nm QX9650은 최대 15%까지 성능 향상이 이루어졌다. 그것도 훨씬 적은 전력을 소모하면서 말이다. 가격은 이전 칩과 동일한 반면 성능은 다소 낫고 전력소모는 훨씬 적다면 구매자 입장에서 무엇을 선택할지 따로 고민할 필요가 없는 게 아닐까.

한편 내년 초로 예정된 AMD의 ‘페놈’ 칩 출시 전까지 인텔은 데스크톱용 쿼드코어 칩의 유일한 공급업체로 남게 될 것이다. @