티스토리 뷰

Study_COM

CPU에 관한 흥미로운 글...;;

WIN-D... 2008. 8. 3. 17:15

컴터 부품 좀 알아보다 흥미로운 글이 있어서 퍼와봅니다...;;




프롤로그

 

 

글을 쓰기에 앞써...

 

 

흔히 CPU벤치마크는 주변에 흔하고 흔하지만 실제 그런 상용 자료들의 대부분이 돈을 받고 기사를 포스팅해 주는 광고성 기사에 불과합니다

 

벤치마크 성능테스트 업체(탐스하드웨어,XBIT랩스등)나 벤치마크 프로그램 업체(3D MARK,산드라.시네벤치등)도 땅파서 장사할 수는 없다는 것을 아신다면 무슨 이야기인지 아실 겁니다

 

반면에 저의 글은 누구에게 10원 한장 안받고 글을 올리는 것이므로 저의 글을 읽고 믿던지 안 믿던지 그것은 개인의 판단에 맡기겠습니다

 

 

본문

 

 

이번 시간에는 세계 최초로 X86 CPU을 중요한 성능 지표인 FLOPS로 성능을 측정해 보는

기회를 마련해 보겠습니다

 

현재 CPU 클럭/FSB/캐쉬 등등 너무나 CPU의 성능을 평가하는 과정이 일반 보통의 유저에게는 복잡하고 너무나 어려운 것은 사실입니다

 

어떤 경우는 인텔 펜티엄4 3.0GHZ가  AMD 브리즈번 4200+(2.2GHZ)보다 빠르다고 친구들끼리 논쟁하는 재미있는 상황이 아직까지도 흔하게 있습니다

 

 

즉 그만큼 기존의 CPU업체가 몇십년동안이나 클럭 성능 마케팅을 얼마나 대대적으로 했는지 알수 있는 대목이며 사람들의 기본적인 의식속에 CPU클럭은 컴퓨터의 성능이란 고정관념이 깊숙이 뿌리 깊이 박혀 있는 실정입니다

 

즉 현재 CPU업계가 멀티코어가 대세가 되어가는 만큼 기존의 CPU 클럭속도는 기존의 컴퓨터 속도를  제대로 측정하는데에 문제가 분명히 있습니다

 

그러한 관점에서 CPU나 전체적인 플램폼의 성능을 한눈에 보기쉽게 알리고

객관적인 성능을 알리는데 있어서 플롭스의 성능이 중요하다라는 판단하에 이번 글을 올리게 되었습니다

 

X86 CPU를 플롭스로 평가하는 것은 세계 처음으로 작성되는 글이니 만큼 자료를 모으는데도 많은 시간과 고민 그리고 노력이 들었으며 객관적인 FPU의 성능을 찾는데 최대한 주력했습니다

 

또한 필자는 X86 CPU 일반용 컴퓨터의 성능에도 플롭스의 수치를 도입하자는

것을 세계  업체 관계자들에게 제안하는 바입니다

 

 

 FLOPS1.jpg

 

 

FLOPS 성능 같은 경우 부동소수점 연산속도로 컴퓨터의 가장 기본이 되는 성능이며

현대 컴퓨터의 성능을 측정하는데 있어서 가장 중요한 성능 평가 방법으로 쓰입니다

 

 

아마 제 자료로 인하여 AMD 페넘 쿼드코어의 가격 상승이 예상되지만 어쨋든 자료는 공개합니다

 

앞으로 AMD 페넘 CPU를 구매할 예정인 분들에게는 죄송스런 글이 될 수도 있겠습니다

 

 

보통 수십억짜리 슈퍼 컴퓨터의 성능을 측정하는 기준점에도

분명히 FPU 혹은 FLOPS 성능 측정 방법이 쓰이며 현대 컴퓨터의 성능을 재는

척도에 있어 FPU는 중요한 의의를 가집니다

 

 

 

그런데 위에 표를 보시면 알겠지만 이상한 생각이 드시는 분도 있을겁니다

슈퍼 파이값(부동소수점값)은 인텔이 AMD보다 훨씬 빠른데 실제 FPU성능은 인텔이 왜 떨어지냐고 말입니다

그것은 현재 인텔이 코어2듀오 콘로 CPU를 만들면서 슈퍼파이 프로그램에 컴파일러를 가지고 장난질을 쳐 놓았기 때문입니다

즉 슈퍼파이의 컴파일러를 콘로 CPU에 최적화를 시켜 놓았다는 뜻입니다

 

 

 

즉 과거에는 Linpack(린팩) Dhrystone(드라이스톤) Whetstone(휘트스톤)등이 FPU 성능

 

이나  ALU 측정방법으로  쓰였으나

 

슈퍼파이값처럼 컴파일러 개선만으로도 FPU 측정 값이 상승해서 현대에 이르러서는

 

SPEC,AIM,코너스톤(Khornerstone)등이 FPU측정 방법으로  쓰이고 있습니다

 

 

 

FPU성능이 중요한 이유

 

가까이는 일반적인 유저가 사용하는 온라인 게임이나 CD 패키지 게임부터 렌더링,동영상 작업,인코딩,그래픽 작업,3D 렌더링,3D작업,UCC 콘텐츠 작업,사진 작업,3DMAX,트랜스 코딩 등에 FPU성능(FLOPS)이 지대한 영향을 미칩니다

 

 

또한 전문적인 작업

 

영화 CG작업,렌더링작업,기후변화,인코딩,모의 3D시뮬, 해양 연구, 지구과학, 천체물리, 입자물리, 플라스마, 나노 과학, 재료공학, 생명공학, 단백질 동역학, 분자 동역학, 열역학,에너지 관리,의학, 건축 시뮬,수치 해석,수학 작업,데이타 분석등 산업전반의 99% 이상의 작업에 FPU성능이 전적으로 엄청난 영향을 미치기 때문입니다

 

 


 

거짓말이 왠만해서 통하지 않는 서버/워크스테이션 컴퓨터

 

 

AMD 9850(CPU 2셋트) 100시간 : 인텔 QX9770(CPU 2셋트) 110시간 :Q6700(CPU 2셋트) 160시간

 

위에 보시면 알겠지만 AMD 9850블랙에디션(2.5GHZ/ 20만원대)의 FPU값이 인텔 QX9650(3.0GHZ/110만원대) 대의 FPU값하고 거의 비슷한 것을 보실수 있습니다

 

또한 2개나 혹은 여러개의 CPU를 동시에 메인보드에 박아 넣은 워크스테이션 버전 같은 경우 인텔 QX9770(3.2GHZ/160만원대)보다 오히려 AMD 9850 블랙에디션(2.5GHZ / 20만원대)의 FPU 성능이  더 빠른 것을 알수 있습니다(대한민국 가격기준)

 

사실 AMD 쿼드코어 9850블랙에디션의 워크스테이션 버전같은 경우 실제 대략 평균가격

150만원~160만원에 육박하지만 인텔 CPU보다 더 잘팔리는 실정입니다

(대한민국 가격기준)

 

 

 

 

왜 이런 상황이 가능하냐 하면 AMD 9850(CPU 2셋트)워크스테이션 컴퓨터로 100시간이

 

걸리는 작업이 있다고 하면 인텔 QX9770(워크스테이션 버전/CPU 2셋트) 같은 경우 110

 

시간의 작업이 걸리고 Q6700(워크스테이션 버전/CPU 2셋트) 같은 경우 160시간 정도의

 

작업 시간이 걸려서 인텔에서 아무리 성능에서 거짓말을 할려고 해도  할수가 없는 구조가

 

서버/워크스테이션용 컴퓨터에는 나오기 때문입니다

 

 

즉 시간이 몇초 몇분 이렇게 차이나는 것도 아니고 몇십시간 넘게 작업시간이 차이나면 도저히 어떻게  할수 없는 결과값이기 때문이죠

 

 

반면에 일반 유저의 컴퓨터라면 보통 금방금방 끝나는 작업이 많기 때문에 충분히 마음만 먹으면 벤치마크 성능테스트 업체와 컴파일러 가지고 장난치는 테스트 프로그램업체(3D마크,산드라)와  손잡고 충분히 성능 그래프 조작이 가능하기 때문입니다

 

 

 

네이버는 평정됐다???

 

 

 

한 모 국회의원이 공식적인 방송에서 "네이버는 평정됐다"라는 말을 했습니다

 

즉 현재 위에 상황과 마찬가지로 인텔이라는 거대 기업이 국내는 다나와,파코즈,브레이박스등의 업체와 결탁하고 외국으로는 탐스하드웨어,테크리포트,XBITLABS등과 결탁하여 마케팅을 하고 있는 실정입니다

 

우스개 소리로 파코즈에 활동이 활발한 유저중에 인텔 직원반, 일반 유저반이라는 이야기가 나돌 정도니까 말입니다

 

그리고 만약 여러분이 벤치마크 업체에 AMD가 천만원을 주고 인텔이 1억원을 준다고 한다면 누구에게 유리한 기사를 쓰겠습니까?

 

 

인텔같은 경우 공식적으로 대한민국에서 불공정 행위로 수백억원의 과징금을 맞았고

또한 유럽연합 및 세계각국에서 불공정 행위로 현재 수사중에 있습니다

 

벤치마크 업체와 그것을 평가하는 벤치마크 프로그램 업체(산드라,3D마크)와 인텔과의 3각 컨넥션은 현재 공공연하게 벌어지고 있습니다

 

이런한 상황에서 현재 공공연한 벤치마크 업체의 조작 행위가 개탄스러울 따름입니다

 

 

 

앞으로 인텔의 CPU발전 방향 예상

 

 

인텔의 앞으로 CPU발전 방향은 아주 간단합니다

인텔은 독창적이고 자신만의 독특한 CPU를 만드는 것을 배제하고

상대편 경쟁 회사인 AMD CPU의 구조를 완전히 베끼고 따라가는데 주력할 것입니다

 

왜냐하면 경쟁 회사인 AMD CPU를 베껴서 성능을 비슷하게만 만든다면 나머지

벤치마크 성능 테스트 회사,벤치마크 프로그램회사,응용 프로그램 회사,게임회사에 엄청난 돈을 풀어 넣어 인텔 CPU에 컴파일러 및 CPU 명령 코드만 인텔 CPU에 최적화 시키면 일반인들이 주로 보는 성능 테스트에서 무조건 인텔의 CPU 점수와 그래프가 높게 나올수 밖에 없는 상황을 만들 것입니다

 

성능은 실제 AMD CPU가 앞서도 절대적으로 인텔 CPU가 벤치마크 점수값은 높게 나올수 밖에 없는  상황이 되어간다는 겁니다

 

 

 

그래프 분석

 


 

실제 위에 도표 분석을 전혀 할려고 하지는 않았으나 초보자 분들의 요청으로 인하여

간단하게 도표 분석을 하겠습니다

 

위에 도표에 몇종의 그래프를 추가하면 300페이지가 넘는 책 한권 쓸 분량의 내용이 나오지만 지면 관계상/시간 관계상 간단하게 도표를 분석해 드리드록 하겠습니다

 

 

 

 

가장 최근에 출시된 CPU인 쿼드코어 CPU부터 살펴보면

 

 

AMD 페넘 쿼드 9850 블랙에디션 (2.5GHZ/FSB 4.0GHZ /가격 20만원대) 33.7기가 플롭스

 

VS 인텔 쿼드 요크필드 QX9650(3.0GHZ/FSB 1.3GHZ /가격 110만원대) 33.8기가 플롭스

 

 

클럭은 오히려 인텔 쿼드 요크필드 QX9650(3.0GHZ)가 클럭수가 높지만 실제 FPU성능은

 

AMD 페넘 쿼드 9850 블랙에디션(2.5GHZ)하고 거의 비슷한 FPU 성능인것을 도표에서 확

 

인 할 수 있습니다

 

 

 

서버 컴퓨터 / 워크 스테이션 컴퓨터

 

WORK STATION  AMD 페넘 쿼드코어 9850BE* 2SET(8CORE CPU)

2.5GHZ FSB 4.0GHZ 가격:300만원대 성능:64.1기가 플롭스

 

VS WORK STATION 인텔 코어2익스트림 요크필드 QX9770*2SET(8CORE CPU)

3.2GHZ FSB:1.6GHZ 가격:320만원대 성능:60.8기가 플롭스

 

VS WORK STATION 인텔 코어2쿼드 켄츠필드 Q6700*2SET(8CORE CPU)

2.66GHZ FSB:1.3GHZ 가격:180만원대 성능:41.2기가 플롭스

 

 

 

위에 나오는 서버 컴퓨터/워크스테이션 CPU들의 이름은 일반용 CPU의 이름과는 전혀 틀립니다

그러나 유저분들의 이해를 쉽게 돕기 위하여 일반적으로 사용자들이 잘 아는 CPU의 이름으로 대체했습니다

서버용/워크스테이션 버전 같은 경우 일반용 프로세서보다 CPU전압을 더 내려서 전력 소모를 줄인  제품으로 출시됩니다

 

 

 

AMD 쿼드 9850 블랙에디션(2.5GHZ/2셋트 CPU)이 64.1기가 플롭스로 가장 성능이 빨랐

 

으며 그뒤를 인텔 코어2익스트림 요크필드 QX9770(3.2GHZ/2셋트 CPU)가 60.8기가 플롭

 

스를 마크하여 2번째 성능을 보여주고 있고 인텔 코어2쿼드 켄츠필드 Q6700(2.66GHZ/2셋

 

트 CPU)는 성능 하락이 심한 41.2기가 플롭스 성능을 표에서 보여주고 있습니다

 

특히 인텔 CPU같은 경우 코어 갯수가 늘어날수록 성능이 크게 떨어지는 점을 도표에서

 

확연하게 확인 할수 있습니다

 

인텔 코어2쿼드 켄츠필드 Q6700(2.66GHZ) 같은 경우 그냥 단일 CPU로 쓸때는 어느정도 성능이 나오는 반면 2개의 인텔 Q6700 CPU를 묶어서 사용하자 낮은 대역폭 FSB 성능 및 급조된 짝퉁 쿼드코어 CPU인 점에 기인하여 엄청나게 성능이 떨어지는 41.2기가 플롭스의 성능 밖에 보여주지 못함을 도표에서 확인 할수 있습니다

 

 

 

AMD 쿼드 9850 블랙에디션(2.5GHZ) 같은 경우 단일 CPU로 사용할때는

인텔 요크필드 QX9650(3.0GHZ)의 성능과 비슷합니다

 

 

그러나 AMD 9850(2.5GHZ) 2개의 CPU를 메인보드에 때려박아 넣자

인텔  CPU중에 최고로 비싼(160만원*2개=320만원대) 인텔 요크필드 QX9770의 성능을 넘어서는 놀라운 성능을 보여줍니다

 

 

계속 CPU의 갯수를 2셋,4셋,8셋,16셋 이렇게 메인보드에 CPU 갯수를 더 넣을수록 AMD 9850BE(2.5GHZ)의 성능과 인텔 QX9770(3.2GHZ)의 성능 격차는 더욱 큰폭으로 벌어지게 되며 AMD 9850블랙에디션(2.5GHZ)이 큰폭으로 인텔 QX9770(3.2GHZ)의 성능을 압도합니다

 

 

즉 인텔의 현재 아키텍처와 플램폼으로는 성능상의 한계에 부딪칠 수 밖에 없으며

인텔이 다음세대 CPU에서 AMD 페넘 CPU의 구조를 완전 모방하고 베낄수 밖에 없음을 위에 도표는 반증합니다

 

 

 

AMD Quad Phenom 9550 (2.2GHZ  FSB 3.6GHZ) 가격:15만원대 성능: 27.1 기가플롭스

VS

INTEL Quad Q6600 (2.4GHz FSB:1.06GHz 8MB) 가격:18만원대 성능: 24.5 기가플롭스

 

 

 

CPU 코어를 1개/2개만 사용하는 프로그램/게임

 

인텔 쿼드 Q6600 (2.4GHz FSB:1.06GHz) > AMD 쿼드 페넘 9550 (2.2GHZ  FSB:3.6GHZ)

 

CPU 코어를 3개/4개 동시에 사용하는 프로그램/게임

 

AMD 쿼드 페넘 9550 (2.2GHZ  FSB:3.6GHZ) > 인텔 쿼드 Q6600 (2.4GHz FSB:1.06GHZ)

 

 

 

흔히 성능 테스트를 보면 성능그래프가 인텔 쿼드 Q6600(2.40GHz)이 AMD 페넘 9550 (2.2GHZ)보다 성능이 좋게 나옵니다

 

그러나 실제로 위에 도표의 FPU 성능을 보시면 AMD 페넘 9550 (2.2GHZ)이 27.1 기가플롭스를 마크하여 인텔 쿼드 Q6600(2.40GHz) 24.5 기가플롭스인 보다 더 빠릅니다

 

 

물론 실제 CPU를 사용해 보면 CPU구조상 CPU를 1개나 2개만 사용하는 CPU프로그램이나 게임에서는 인텔 쿼드 Q6600(2.40GHz)>AMD 쿼드 9550(2.2GHZ)인 것은 사실입니다

 

그러나 CPU구조상 CPU사용갯수가 3개나 4개를 동시에 사용하는 CPU프로그램이나 게임이라면

 

AMD 쿼드 9550(2.2GHZ)>인텔 쿼드 Q6600(2.4GHZ)입니다

 

왜나하면 인텔 쿼드 Q6600(2.4GHZ)는 CPU 코어가2개씩 나누어져 있어서 CPU2개 이하를 쓰는 프로그램에서는 제성능을 발휘하나 CPU사용갯수가 3개를 넘어가는 프로그램인 경우 CPU간에 상호 작용이 원활하게 안되서 AMD 쿼드 9550(2.2GHZ) 가 더 빠른 성능을 보이게 됩니다

 

앞으로 쿼드 지원 프로그램이나 게임이 계속 늘어나는 점을 감안해 본다면 오히려 현명한 선택은 어느쪽인지의 판단은 유저분들에게 맡기겠습니다

 

 

흔히 성능 그래프가 Q6600이 더 좋게 나오는 원인은

 

1.현재 나오는 테스트 벤치 마크 프로그램 자체가 인텔 컴파일러나 인텔 명령어에 최적화 되어 있기때문에 점수 놀이에서는 인텔의 CPU가 성능 그래프가 좋게 나올수 밖에 없습니다

 

2.실제 현재 테스트 프로그램이나 게임중에 쿼드 코어 CPU를 제대로 평가할수 있는 프로그램 자체가 적은  것도 한가지 원인입니다

 

3.인텔 코어2듀오 CPU는 2개의 CPU가 단위체로 묶여있는 구조라 듀얼코어 기반 프로그램에서 성능을 발휘합니다

 

반면에 쿼드코어 CPU를 제대로 테스트 하는 프로그램/고해상도 게임으로 가면 인텔 쿼드코어 같은 경우 CPU 2개를 급조해서 이어붙인 구조라 속도가 느려질수 밖에 없습니다

 

4. 그러나 AMD 쿼드코어 같은 경우 CPU 4개가 유기적으로 작업하여 CPU 4개를 쓰는 작업에서는 더 빠른 결과 값이  나오며 AMD 페넘 같은 경우 L2캐시는 따로 독립되어 있고 L3캐시에서 CPU가 묶여있는 구조라 오히려 다중 접속 작업/복잡한 작업/온라인게임 다계정 접속/아프리카 방송용도/멀티 태스킹 작업/가상화 다중 OS등에서는

AMD 페넘 9550(2.2GHZ)가 인텔 쿼드 Q6600(2.4GHZ)를 엄청나게 압도할 수 밖에 없습니다

 

 

   

 

AMD X3 톨리만 8650(2.3GHZ/13만원대) VS 인텔 울프데일 E8400(3.0GHZ/16만원대)

 

 

AMD 페넘-X3 톨리만 8650(2.3GHZ) 과 인텔 울프데일 E8400(3.0GHZ)같은 경우 클럭만 높고 보면 AMD 8650(13만원대)은 인텔  E8400(16만원대)보다 속도가 느릴 수 밖에 없습니다

 

실제로도 클럭속도에 의존하는 벤치마크 같은 경우 인텔 울프데일의 E8400 점수가 잘 나올수 밖에 없죠

 

그러나 AMD X3 8650(2.3GHZ/3코어 CPU) L2캐시 3개 / 통합 L3캐시 내장 ->

20.4기가 플롭스

 

VS 인텔 울프데일 E8400(3.0GHZ/2코어 CPU) L2캐시 1개     ->

16.9기가 플롭스

 

를 보자면 무엇인가 감이 오시지 않습니까?

 

 

첫째

 

코어 갯수가 AMD 페넘-X3 톨리만 8650(2.3GHZ)은 인텔 울프데일 E8400(3.0GHZ)보다 CPU코어 갯수가 1개 더 많습니다

 

근래의 온라인 게임 조차도 듀얼코어(2개) CPU를 지원하는 게임이 엄청 많아졌습니다

 

그런데 듀얼코어 지원 게임에서 2개의 CPU자원을 100%꽉차게 쓰고 있는 상황에서

 

예를 들어 리니지2/ 월드 오브 워크래프트/ 아바 /디아블로3  등의 게임에서 플포 열어서 퀘스트 를 알아보면서 게임을 한다거나 알약/V3 등의 실시간 바이러스 체킹을 하면서

게임을 한다면

인텔 울프데일 E8400의 CPU점유율은 100%가  넘어가면서 게임 속도가 느려지는 반면에

 

AMD X3 8650(2.3GHZ/3코어 CPU)같은 경우 2개의 CPU 자원을 다 써도(68%) 1개의 CPU자원(32%)이 넉넉하게 남아 도는 관계로 원활한 게임 진행이 가능하게 됩니다

 

특히나 근래 같은 경우 아프리카 TV방송에서 자신의 게임 장면을 방송으로 내보내 다던지

자신의 TV화면을 아프리카 TV로 중계하는 경우등이 있습니다

 

이러한 경우 듀얼코어 지원 게임이라면 게임에서 CPU자원을 100% 거의 다써서 아프리카 TV를  방송에 내보내야 하는 CPU자원이 모자르는 경우가 생기게 됩니다

 

이러한 경우 실제 게임에서 느려질 수  밖에 없는 경우가 생기게 됩니다

즉 CPU 코어 갯수가 넉넉할수록 어려운 작업이나 다중 작업에 더 적합하다는 것입니다

 

 

 

 

둘째 동영상 인코딩+온라인 게임을 동시에 한다면?

 

 

보통 집에 컴퓨터가 여러대라면 인코딩을 다른 컴퓨터에 시켜놓고 한쪽 컴퓨터는

게임을 하면 좋겠지만 집에 여러대의 컴퓨터를 가지고 있지 않은 사람이라면

한대의 컴퓨터로 여러가지 멀티 태스킹 작업을 하게 됩니다

즉 컴퓨터로 인코딩을 하면서 동시에 게임을 하는 상황도 나올수 있습니다

이러한 상황에서 게임 속도가 궁금하지 않습니까?

 

곰인코더+워드 오브 워크래프트 이렇게 2가지 게임을 동시에 돌릴때 게임 속도 입니다

 

 

물론 게임 1가지만 할때는 인텔 울프데일 E8400(3.0GHZ)이 AMD 8650(2.3GHZ)보다 게임에서 더 빠릅니다

 

그러나 인코딩+게임 2가지를 동시에 한다면 2개의 CPU상황은 완전 뒤 바뀌게 됩니다

 

 

AMD 페넘-X3 톨리만 8650(2.3GHZ) 39프레임 VS 인텔 울프데일 E8400(3.0GHZ) 19프레임

 

 

오히려 AMD 페넘-X3 톨리만 8650(2.3GHZ)이 평균 39프레임을 찍어서

 인텔 울프데일 E8400(3.0GHZ)의 평균 19프레임보다 2배가 넘는 게임 속도가 나오게 됩니다

 

이렇게 동시에 게임/음악/바이러스 실시간 체킹/인코딩/온라인 게임 다중접속계정등의

이러한 작업중에서 2가지~3가지 이상의 작업을 동시에 한다면 오히려 인텔 울프데일 E8400(3.0GHZ)같은 경우 버벅이는 현상이 발생하며 오히려 게임 속도가 엄청나게 줄어드는 현상이 발생합니다

 

근래에 듀얼코어 이상 지원 게임이 계속 늘어나는 상황을 감안한다면 컴퓨터를 바꾸는게 귀찮아서 오래 컴퓨터를 사용하실 분들에게는 오히려 인텔 울프데일 E8400은 곤란한 점이 있지 않을까요?

   




참고자료

 

 

세계 최고로 빠른 슈퍼 컴퓨터 로드러너(AMD 옵테론 CPU장착)

 

 

세계 최고로 빠른 슈퍼 컴퓨터는 IBM+AMD 옵테론 CPU가 세계 최고로 빠른 슈퍼 컴퓨터가 됐다

 

 ‘로드러너’는 AMD X86 옵테론 프로세서를 채용해 하이브리드 성격을 띠고 있다

로드러너’는 278개의 냉장고 크기의 서버랙을 사용하며 6천562개의 AMD 듀얼코어 ‘옵테론’ 프로세서와  1만2천240개의 ‘셀’ 프로세서를 연결한다.

 

 

서버컴퓨터/워크스테이션 컴퓨터/슈퍼 컴퓨터가 필요한 이유

 

 

 컴퓨터 모의실험의 정밀도를 높일 필요성이 점점 커지고 있고,

 분석해야 할 데이터의 양도 기하급수적으로 증가하고 있기 때문입니다

 만약 계산에 필요한 정밀도를 10배 올리면 이에 필요한 계산시간은

100배에서 많게는 10000 배 이상으로 기하급수적으로 늘어나기 때문이죠

 

만약 1시간 걸리는 작업의 정밀도를 10배 높이면 걸리는 시간은 엄청나게 늘어납니다

1시간 걸리던 작업의 정밀도를 10배 높이면 작업의 종류에 따라서는 3일에서 400일까지도 걸리니 엄청나게 시간이 늘어납니다

 

 

플롭스 FLOPS (floating-point operations per second)

 

플롭스는 초당 수행할 수 있는 실수 연산(부동소수점)의 횟수를 의미하는 컴퓨터 성능 단위이다.

 

예를 들어 1메가 플롭스라면 1초에 백만번의 실수을 처리할 수 있다는 것을 의미한다.

플롭스 단위는 일반적으로 컴퓨터의 실수연산(FPU) 성능을 나타낼 때 주로 이용하고 있다.

 

 

[ Linpack : 린팩 ] - linear programming package(선형 프로그래밍 패키지)의 약어.

 

 

 주로 선형 방정식과 선형 최소 제곱법 문제를 풀기 위해 100 100과 1000 1000 요소로 구성된

배열을 푸는 포트란 서브루틴들로 구성된 수치 해석 패키지의 하나.

 

 이는 컴퓨터의 연산속도를 측정하는 벤치마크 프로그램으로 이용되기도 한다.

 프로그램 크기가 최근에 적용되는 캐시기억장치 크기보다 작아 실제 수행능력을 평가하는데 부족함이 있다.

 

그래서 최근에는 사용자가 실제 사용하는 응용프로그램 환경에서의

수행속도를 측정하기 위해 SPEC,AIM,코너스톤(Khornerstone) 등이 사용되고 있다.

 배정도실수 연산능력을 평가하는 프로그램은 DP(double-precision) Linpack이라 한다.

 

 

 

 

[ Dhrystone : 드라이스톤 ] -

 

 컴퓨터의 수행속도를 비교하는 데 사용되는 벤치마크 프로그램의 일종. 정수계산 및 레코드와 포인터 조작 등을 위한 연산을 행하고 I/O 작업, 운영체제 호출(Operating system calling) 및 실수 연산은 하지 않는다.

 

 1984년 Ada 언어로 최초 작성되었고 1989년부터 C와 Pascal 버전이 많이 사용되고 있다.

드라이스톤 1.1 프로그램이 수행된 결과가 약 1757 Dhrystone/초 정도이면 VAX-11/780을 기준으로 1Mips 정도 된다.

 

원시 프로그램을 시험하고자하는 컴퓨터에서 컴파일 한 후 실행시키므로

 

하드웨어 개선없이 단지 시험하고자하는 루틴에 해당하는 컴파일러 부분만을 개선하여도

 

빠른 결과를 얻을 수 있으므로 신뢰도가 떨어진다.

 

 

 

 

[ Whetstone : 휘트스톤 ] -

 

주로 부동소수점 처리 성능(Flops)을 평가하는 표준적인 벤치마크(benchmark)

 프로그램의 하나. 부동소수점 처리성능을 평가하는 최초의 프로그램이었다.

 

 많은 종류의 초월함수를 이용하는 방법을 기본으로 단정도 및 배정도 실수를 계산하는

 프로그램이 각각 존재한다.

 

정수처리능력을 평가하는 드라이스톤 벤치 프로그램처럼 컴파일러에 의존하므로 신뢰도가 떨어진다.

 

 

끝마치며

 

 

다나와는 인텔의 하청 업체정도에 불과하므로 이 글은 금방 삭제될 위험이 있습니다

 

삭제하기 전에 그래프나 글을 블로그나 각종 카페에 퍼가 주시면 감사하겠습니다

 

자료의 무단 복제는 무조건 가능하며 자료의 내용만 단지 안바꾸어 주시면 됩니다

 

마음껏 퍼가시기 바랍니다

 

 

 

최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함