一、評(píng)測(cè)背景
產(chǎn)品創(chuàng)新是制造企業(yè)贏得市場(chǎng)競(jìng)爭(zhēng)的重要手段之一,也是獲得高額利潤(rùn)的有效方式。過(guò)去,中國(guó)制造企業(yè)的主要依賴(lài)產(chǎn)品的后期制造來(lái)獲得利潤(rùn),但是隨著市場(chǎng)環(huán)境的變化,企業(yè)逐漸認(rèn)識(shí)到——制造業(yè)的競(jìng)爭(zhēng)實(shí)質(zhì)是產(chǎn)品創(chuàng)新的競(jìng)爭(zhēng),擁有自主產(chǎn)品創(chuàng)新能力的企業(yè),才能占領(lǐng)市場(chǎng)優(yōu)勢(shì)地位。在產(chǎn)品創(chuàng)新研發(fā)過(guò)程中,CAE是企業(yè)保證產(chǎn)品質(zhì)量、減少成本、降低研發(fā)周期并快速響應(yīng)市場(chǎng)的重要技術(shù)手段。因此,隨著市場(chǎng)競(jìng)爭(zhēng)節(jié)奏的不斷加快,越來(lái)越多的制造企業(yè)開(kāi)始引入CAE技術(shù),并建立仿真分析部門(mén)。
另一方面,隨著產(chǎn)品復(fù)雜程度的不斷增大,企業(yè)仿真分析部門(mén)又面臨著新的挑戰(zhàn)。比如隨著復(fù)雜產(chǎn)品模型所包含的數(shù)據(jù)量不斷增加,為了實(shí)現(xiàn)對(duì)產(chǎn)品在實(shí)際工作中的性能表現(xiàn)更為精確的模擬,還需進(jìn)行多學(xué)科仿真,這些仿真計(jì)算耗時(shí)越來(lái)越長(zhǎng),有時(shí)甚至需要幾天,嚴(yán)重制約了產(chǎn)品研發(fā)進(jìn)程。同時(shí),在CAE軟件環(huán)境中進(jìn)行前后處理時(shí),復(fù)雜模型的操作以及結(jié)果云圖、動(dòng)畫(huà)的生成對(duì)圖形顯示的要求也越來(lái)越高,圖形顯示能力直接影響著工程師的操作體驗(yàn)以及分析結(jié)果獲取的準(zhǔn)確度。
幸運(yùn)的是,近年來(lái)隨著GPU加速計(jì)算的興起,利用GPU來(lái)加速CAE分析已經(jīng)成為一種趨勢(shì)。GPU強(qiáng)大的并行計(jì)算能力能有效地對(duì)圖形計(jì)算和仿真分析過(guò)程的大規(guī)模數(shù)據(jù)進(jìn)行并行浮點(diǎn)處理,大幅加速產(chǎn)品的虛擬仿真分析過(guò)程,從而有效的縮短產(chǎn)品的研發(fā)周期。從成本上講,CPU+GPU的搭配模式,不斷能有效的減少企業(yè)購(gòu)買(mǎi)的軟件許可證費(fèi)用,還可以降低企業(yè)在工作站購(gòu)買(mǎi)上的硬件投入成本。
二、測(cè)試平臺(tái)
為了更好的讓企業(yè)了解GPU加速給CAE分析過(guò)程帶來(lái)的性能提升,e-works特別安排了一次針對(duì)麗臺(tái)Quadro K6000專(zhuān)業(yè)顯卡的性能評(píng)測(cè),而本次選用的平臺(tái)為麗臺(tái)最新推出的Maximus工作站。平臺(tái)的詳細(xì)配置如下:
表1 測(cè)試平臺(tái)配置
Quadro K6000是麗臺(tái)科技2013年最新發(fā)布的頂級(jí)專(zhuān)業(yè)級(jí)工作站顯卡,該顯卡擁有2880個(gè)流處理器、240個(gè)紋理處理單元和48個(gè)ROP單元,單精度浮點(diǎn)性能為5.2TFlops,雙精度浮點(diǎn)計(jì)算能力大約為1.7TFlops,也是目前超高端專(zhuān)業(yè)顯卡市場(chǎng)計(jì)算性能最強(qiáng)大的顯卡之一。同時(shí),本次測(cè)試搭配的Maximus工作站也是麗臺(tái)公司針對(duì)制造企業(yè)的高性能研發(fā)計(jì)算領(lǐng)域主推的平臺(tái),Maximus工作站可以同時(shí)搭配Tesla高性能圖形計(jì)算卡和Quadro高性能專(zhuān)業(yè)顯卡,實(shí)現(xiàn)設(shè)計(jì)和仿真應(yīng)用的一體化,也目前市場(chǎng)上唯一一款集產(chǎn)品的設(shè)計(jì)、仿真分析于一體的工作站平臺(tái),其最重要的價(jià)值是能實(shí)現(xiàn)設(shè)計(jì)與仿真計(jì)算的并行,從而大幅提升制造企業(yè)的產(chǎn)品研發(fā)效率。
圖1 麗臺(tái)Quadro K6000專(zhuān)業(yè)顯卡
圖2 麗臺(tái)Maximus工作站
圖3 winFast WS2000工作站規(guī)格
三、測(cè)試軟件介紹
Abaqus是一套功能強(qiáng)大的工程模擬的有限元軟件,其解決問(wèn)題的范圍從相對(duì)簡(jiǎn)單的線(xiàn)性分析到許多復(fù)雜的非線(xiàn)性問(wèn)題。作為通用的模擬工具,除了能解決大量結(jié)構(gòu)問(wèn)題,Abaqus還可以模擬其他工程領(lǐng)域的許多問(wèn)題,例如熱傳導(dǎo)、質(zhì)量擴(kuò)散、熱電耦合分析、聲學(xué)分析、巖土力學(xué)分析及壓電介質(zhì)分析。由于Abaqus優(yōu)秀的分析能力和模擬復(fù)雜系統(tǒng)的可靠性使得它在各國(guó)的工業(yè)和研究中得到廣泛的使用,在大量的高科技產(chǎn)品研究中也發(fā)揮著巨大的作用。Abaqus軟件從6.11版本開(kāi)始可以支持NVIDIA的GPU加速技術(shù),本次評(píng)測(cè)使用的是最新的Abaqus 6.13版本。
圖4 ABAQUS/CAE 6.13
四、性能測(cè)試
本次評(píng)測(cè)即在Abaqus環(huán)境下,測(cè)試麗臺(tái)Quadro K6000通過(guò)GPU技術(shù)對(duì)CAE工作中圖形顯示增強(qiáng)和計(jì)算加速的效果。
1.評(píng)測(cè)思路
CAE分析主要有三個(gè)步驟,即:前處理、有限元求解計(jì)算、后處理。前處理中為產(chǎn)品建立合理的有限元分析模型,并進(jìn)行單元屬性定義、網(wǎng)格劃分和載荷施加;有限元求解計(jì)算就是對(duì)有限元模型進(jìn)行單元特性分析并求解的過(guò)程;后處理則根據(jù)工程或產(chǎn)品設(shè)計(jì)要求對(duì)有限元分析結(jié)果進(jìn)行分析進(jìn)而論證設(shè)計(jì)的合理性并優(yōu)化,以滿(mǎn)足客戶(hù)對(duì)產(chǎn)品的設(shè)計(jì)需求。本次評(píng)測(cè)主要?jiǎng)澐譃橐韵聨讉(gè)步驟:
1)模型導(dǎo)入后的基本操作
如同其他CAE軟件,Abaqus的建模功能有限,只適合建立簡(jiǎn)單部件。為了充分測(cè)試在CAE軟件環(huán)境下的大模型顯示效果及操作流暢度,本次評(píng)測(cè)選擇從外部導(dǎo)入復(fù)雜模型,并對(duì)其進(jìn)行平移,局部放大縮小,旋轉(zhuǎn),剖切,線(xiàn)框切換等基本操作。
2)有限元求解計(jì)算
作為整個(gè)CAE分析中計(jì)算強(qiáng)度最高的部分,有限元求解計(jì)算耗時(shí)直接影響整個(gè)CAE分析周期的長(zhǎng)短。本次評(píng)測(cè)將記錄在CPU數(shù)量調(diào)用相同時(shí),無(wú)GPU加速、有GPU加速、GPU并行加速三種情況下求解計(jì)算過(guò)程所耗時(shí)間,進(jìn)行對(duì)比分析得出GPU加速效果。
3)結(jié)果云圖與動(dòng)畫(huà)的生成與顯示
有限元計(jì)算完成之后,為了更加清晰直觀的以圖像形式顯示出結(jié)果,需要生成應(yīng)力應(yīng)變?cè)茍D及動(dòng)畫(huà),復(fù)雜模型計(jì)算結(jié)果云圖及動(dòng)畫(huà)的顯示效果對(duì)顯卡要求較高。
4)拼接屏
憑借 DisplayPort 1.2,Quadro K6000單卡可支持四臺(tái)同時(shí)工作的顯示器和最高 4k 分辨率。通過(guò)NVIDIA Mosaic 多顯示器技術(shù),在不犧牲性能或處理能力的情況下,可在一臺(tái)工作站上輕松地將所有應(yīng)用程序的畫(huà)面擴(kuò)展到多臺(tái)高分辨率顯示器或投影儀上。
2.CAE測(cè)試分析
本次選用的測(cè)試模型是一個(gè)發(fā)動(dòng)機(jī)裝配體,網(wǎng)格劃分節(jié)點(diǎn)數(shù):1060943,單元數(shù)665799,進(jìn)行靜力學(xué)分析。如圖5所示。
圖5 發(fā)動(dòng)機(jī)裝配體
1.模型基本操作
圖6 局部放大
圖7 平移操作
圖8 模轉(zhuǎn)操作
對(duì)模型載入、縮放、旋轉(zhuǎn)以及編輯操作均比較流暢,基本上都在瞬間完成,這也說(shuō)明在設(shè)計(jì)性能上完全能滿(mǎn)足要求。同時(shí),我們發(fā)現(xiàn)不論是模型的色彩還是線(xiàn)條都非常之清晰。以前也做過(guò)很多專(zhuān)業(yè)圖形顯卡及工作站的評(píng)測(cè),但很少看到模型色彩有著如此良好的光澤度。對(duì)設(shè)計(jì)工程師而言,色彩真實(shí)且操作流暢的設(shè)計(jì)平臺(tái)能大大的提升使用體驗(yàn)和效率。
2.有限元分析
前處理完成后即開(kāi)始進(jìn)行有限元分析計(jì)算求解,這也是整個(gè)CAE分析過(guò)程中最耗費(fèi)時(shí)間的環(huán)節(jié),計(jì)算時(shí)間過(guò)長(zhǎng)甚至嚴(yán)重拖慢整個(gè)產(chǎn)品開(kāi)發(fā)流程。對(duì)此,借助近些年興起的高性能計(jì)算技術(shù),從硬件和軟件兩方面支持并行計(jì)算,可以大大縮短CAE計(jì)算求解時(shí)間。
以前的CAE應(yīng)用評(píng)測(cè)中,都是對(duì)比調(diào)用不同核數(shù)情況下的求解耗時(shí),得出多核調(diào)用對(duì)計(jì)算效率提高的水平。而近些年興起的GPU技術(shù)除了提升顯卡性能之外,也能通過(guò)其強(qiáng)大的運(yùn)算能力,大大縮短計(jì)算時(shí)間,這種加速能力在對(duì)圖形顯示處理水平要求很高的CAE分析工作中則顯得更為重要。因此本次評(píng)測(cè)一個(gè)很重要的目的就是測(cè)試GPU加速技術(shù)對(duì)CAE分析求解計(jì)算的加速水平如何。
本次測(cè)試平臺(tái)搭配了2顆6核心12線(xiàn)程的處理器,因此共有12核心24線(xiàn)程可進(jìn)行計(jì)算調(diào)用。另外,由于搭配了麗臺(tái)Quadro K6000專(zhuān)業(yè)顯卡,我們也通過(guò)將GPU的計(jì)算能力融入到分析中來(lái)感受計(jì)算性能的提升。表2為發(fā)動(dòng)機(jī)裝配體靜載荷求解計(jì)算的耗時(shí)數(shù)據(jù)。
表2 有限元分析測(cè)試數(shù)據(jù)(單位:秒)
對(duì)于表2中的數(shù)據(jù),我們可以主要關(guān)注前面三項(xiàng),UseTime為模型的實(shí)際計(jì)算時(shí)間,System Time是指計(jì)算過(guò)程中的時(shí)間損耗(花費(fèi)在傳輸以及指令流分配等過(guò)程的時(shí)間),Total CPU Time為整個(gè)CPU計(jì)算耗時(shí),為User Time與System Time時(shí)間之和。對(duì)比表2數(shù)據(jù),我們可以很清楚的發(fā)現(xiàn)在調(diào)用GPU和不調(diào)用GPU的場(chǎng)景中的計(jì)算時(shí)間有著非常大的區(qū)別。比如在2CPU場(chǎng)景中,調(diào)用GPU時(shí),CPU總耗時(shí)長(zhǎng)為2012.1秒,而不調(diào)用GPU時(shí),CPU總耗時(shí)長(zhǎng)為4860.3秒,GPU的加入將CPU的計(jì)算時(shí)長(zhǎng)縮短了近60%。而這種時(shí)長(zhǎng)的縮短在4CPU、8CPU、16CPU和24CPU場(chǎng)景中分別為:54%、38%、51%和51%,換言之,GPU計(jì)算能力的加入使得整機(jī)的圖形計(jì)算性能提升了超過(guò)1倍。
圖9 計(jì)算耗時(shí)對(duì)比(User Time)
圖10 總計(jì)耗時(shí)對(duì)比(Total Time)
圖9和圖10為調(diào)用GPU和未調(diào)用GPU性能場(chǎng)景下的耗時(shí)對(duì)比。我們從數(shù)據(jù)中可以得出結(jié)論,即圖形計(jì)算過(guò)程中并非調(diào)用了CPU核心越多,計(jì)算速度就越快。因?yàn)檎{(diào)用的CPU核心越多,計(jì)算資源的分配過(guò)程就越復(fù)雜,這會(huì)降低CPU的計(jì)算效率。比如在不調(diào)用GPU的情況下,2CPU和4CPU計(jì)算所花費(fèi)的時(shí)間為4826秒和4994秒,而隨著核心數(shù)量的增多,計(jì)算所耗費(fèi)的時(shí)間也越長(zhǎng)。因此,在進(jìn)行大規(guī)模圖形數(shù)據(jù)計(jì)算時(shí),用戶(hù)必須謹(jǐn)慎對(duì)待多核心的調(diào)用,在調(diào)用多核心進(jìn)行計(jì)算時(shí),盡可能的找到最佳的性能點(diǎn)。這種情況也同樣出現(xiàn)在CPU與GPU之間,調(diào)用的CPU核心越多,耗費(fèi)在CPU與GPU之間的資源分配時(shí)間越長(zhǎng),計(jì)算時(shí)間也就越長(zhǎng)。
也有很多用戶(hù)會(huì)經(jīng)常問(wèn)到,GPU為何能擁有如此強(qiáng)大的圖形計(jì)算能力?這是因?yàn)镚PU的出現(xiàn)一開(kāi)始就是為了緩解CPU的計(jì)算壓力,將CPU從圖形計(jì)算中解脫出來(lái)。因此,GPU在架構(gòu)設(shè)計(jì)上就非常適合于對(duì)大量圖形數(shù)據(jù)的處理。GPU的內(nèi)核設(shè)計(jì)的是并行架構(gòu),適合在短時(shí)間內(nèi)處理大量類(lèi)似結(jié)構(gòu)的數(shù)據(jù),比如圖形計(jì)算、生物工程以及科研分析等。近年來(lái),隨著GPU技術(shù)的發(fā)展,GPU的性能越來(lái)越強(qiáng)大,因此出現(xiàn)了像Maximus工作站這樣的集設(shè)計(jì)與分析與一體的圖形工作站,通過(guò)搭配Quadro K6000專(zhuān)業(yè)圖形顯卡,大幅提升企業(yè)的研發(fā)設(shè)計(jì)效率。
3.結(jié)果云圖與動(dòng)畫(huà)的生成與顯示
有限元分析計(jì)算完成并得到了位移、應(yīng)力或其它基本變量之后,就可以對(duì)計(jì)算結(jié)果進(jìn)行評(píng)估。評(píng)估通常可以通過(guò)CAE軟件可視化模塊或其它后處理軟件在圖形環(huán)境下交互式進(jìn)行。為了更為直觀清晰呈現(xiàn)出計(jì)算結(jié)果,可視化模塊可以讀入計(jì)算結(jié)果文件病以多種方法顯示結(jié)果,包括彩色等值線(xiàn)圖、云圖、動(dòng)畫(huà)等。
本環(huán)節(jié)直接在Abaqus圖形界面環(huán)境中打開(kāi)之前有限元分析步驟中生成的輸出文件(后綴名.odb),然后利用Abaqus中的Visualization功能模塊來(lái)生成結(jié)果云圖和動(dòng)畫(huà)。
圖11 發(fā)動(dòng)機(jī)裝配體靜載荷分析U2應(yīng)變?cè)茍D1
圖12 發(fā)動(dòng)機(jī)裝配體靜載荷分析U2應(yīng)變?cè)茍D2
圖13 發(fā)動(dòng)機(jī)裝配體靜載荷分析U3應(yīng)變?cè)茍D1
圖14 發(fā)動(dòng)機(jī)裝配體靜載荷分析U3應(yīng)變?cè)茍D2
在評(píng)測(cè)中,圖形展示清晰度高,能滿(mǎn)足工程師對(duì)計(jì)算結(jié)果進(jìn)行準(zhǔn)確評(píng)估的要求,而且在對(duì)結(jié)果云圖展示模式下的模型進(jìn)行旋轉(zhuǎn)平移、放大縮小等操作時(shí),也不存在停滯感。隨后對(duì)整個(gè)應(yīng)變過(guò)程進(jìn)行動(dòng)畫(huà)生成,動(dòng)畫(huà)畫(huà)面清晰、播放過(guò)程中應(yīng)變等值線(xiàn)變化流暢,能夠很好的反映出整個(gè)過(guò)程。從動(dòng)畫(huà)中截取了四張圖進(jìn)行觀察,等值輪廓線(xiàn)非常清晰,可以準(zhǔn)確的反應(yīng)出應(yīng)變結(jié)果。
圖15 應(yīng)變過(guò)程動(dòng)畫(huà)截圖1
圖16 應(yīng)變過(guò)程動(dòng)畫(huà)截圖2
圖17 應(yīng)變過(guò)程動(dòng)畫(huà)截圖3
圖18 應(yīng)變過(guò)程動(dòng)畫(huà)截圖4
4.拼接屏
Quadro K6000單卡可支持四臺(tái)同時(shí)工作的顯示器,通過(guò)NVIDIA Mosaic 多顯示器技術(shù),在不犧牲性能或處理能力的情況下,可在一臺(tái)工作站上輕松地將所有應(yīng)用程序的畫(huà)面擴(kuò)展到多臺(tái)高分辨率顯示器或投影儀上。評(píng)測(cè)采用4臺(tái)1080P高清顯示器,2 x 2布局,實(shí)現(xiàn)單卡4屏拼接總分辨率3840 x 2160 @ 60Hz。
圖19 mosaic拼接屏設(shè)置
圖20 4臺(tái)高畫(huà)質(zhì)顯示屏拼接
五、總結(jié)
本次重點(diǎn)在于測(cè)試Quadro K6000工作站顯卡在CAE平臺(tái)上的性能,通過(guò)對(duì)發(fā)動(dòng)機(jī)裝配體進(jìn)行有限元分析、云圖生成以及拼接屏等操作來(lái)感受Quadro K6000工作站顯卡給工程師設(shè)計(jì)與分析帶來(lái)的性能提升。測(cè)試中我們首先對(duì)發(fā)動(dòng)機(jī)模型進(jìn)行了載入、旋轉(zhuǎn)和修改操作,過(guò)程非常之流暢,感覺(jué)不到任何因性能不足而導(dǎo)致的拖影或卡屏的現(xiàn)象。在有限元分析過(guò)程中,我們通過(guò)對(duì)比在調(diào)用GPU和不調(diào)用GPU環(huán)境下的計(jì)算與分析耗時(shí),測(cè)試過(guò)程充分證明了GPU能大幅加速模型的分析過(guò)程,測(cè)試結(jié)果顯示,在調(diào)用GPU進(jìn)行分析時(shí),計(jì)算耗時(shí)能至少減少一半以上。對(duì)企業(yè)而言,產(chǎn)品設(shè)計(jì)與分析時(shí)間的縮短能減少產(chǎn)品的設(shè)計(jì)周期,從而提升企業(yè)的市場(chǎng)競(jìng)爭(zhēng)力。最后我們還進(jìn)行了云圖生成及拼接屏的性能測(cè)試,云圖生成主要是為了將有限元分析結(jié)果以圖象或動(dòng)畫(huà)的形式來(lái)展現(xiàn)出來(lái),使得測(cè)試的效果更佳清晰。因此對(duì)圖形顯示性能要求較高。從測(cè)試結(jié)果看,云圖生成過(guò)程非常順利,而且在很短時(shí)間內(nèi)就完成,生成的圖像及動(dòng)畫(huà)質(zhì)量也非常好,這充分顯示了Quadro K6000工作站顯卡的強(qiáng)大性能。同時(shí),我們也深刻感受到了Maximus工作站穩(wěn)定的性能。
在以往的測(cè)試中,e-works評(píng)測(cè)人員基本上選用的都是較為常用的圖形工作站,但Maximus工作站與這些產(chǎn)品有所不同。在設(shè)計(jì)上,Maximus工作站有著更長(zhǎng)的機(jī)箱,更強(qiáng)大的電源系統(tǒng)和風(fēng)扇。在功能上,Maximus工作站能同時(shí)搭配Quadro工作站顯卡和Tesla高性能計(jì)算卡,并能根據(jù)計(jì)算數(shù)據(jù)類(lèi)型來(lái)自動(dòng)選擇Quadro或Tesla。這使得Maximus工作站不但能做基本的CAD圖形設(shè)計(jì),而且還能進(jìn)行CAE仿真分析,滿(mǎn)足企業(yè)大規(guī)模圖形數(shù)據(jù)計(jì)算的需求。
總體來(lái)說(shuō),制造企業(yè)要提升市場(chǎng)競(jìng)爭(zhēng)力,就必須設(shè)計(jì)市場(chǎng)需求的產(chǎn)品,更好、更快的根據(jù)市場(chǎng)需求開(kāi)發(fā)用戶(hù)需要的產(chǎn)品是考驗(yàn)企業(yè)市場(chǎng)生存能力的關(guān)鍵。因此,擁有一款好的開(kāi)發(fā)和設(shè)計(jì)平臺(tái)至關(guān)重要。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴(lài)品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://www.oesoe.com/
本文標(biāo)題:麗臺(tái)Quadro K6000工作站顯卡CAE性能評(píng)測(cè)報(bào)告
本文網(wǎng)址:http://www.oesoe.com/html/consultation/10839612273.html