2017年,圖靈獎獲得者JohnHennessy與DavidPatterson在其“計算機體系架構(gòu)的黃金年代”主題演講中指出,由于目前通用計算的性能瓶頸,需要面向不同應(yīng)用場景開發(fā)針對性優(yōu)化的架構(gòu),他們給出的解決方案是DSA。
所謂DSA(domainspecificarchitecture,特定領(lǐng)域架構(gòu)),是一種針對特定領(lǐng)域定制的可編程處理器,能夠用于加速某些應(yīng)用程序,實現(xiàn)更好的性能和性價比。
尤其是在當前摩爾定律放緩的趨勢下,DSA更是成為一種持續(xù)提升處理器性能的重要技術(shù)理念,即采用可編程的專用集成電路去加速特定的高強度的處理器負載,比如加速圖形渲染、加速AI神經(jīng)網(wǎng)絡(luò)的前向推理計算、提高巨量網(wǎng)絡(luò)數(shù)據(jù)的吞吐等。
可以簡單理解為,以CPU為代表的通用計算芯片架構(gòu),已經(jīng)無法很好地匹配和滿足當前的市場需求,所以在AI、云計算、自動駕駛等各類新技術(shù)和應(yīng)用層出不窮的同時,“通不如精”成為處理器架構(gòu)的演進趨勢,智能計算需求激增的背后,是從傳統(tǒng)的通用芯片向?qū)S妙I(lǐng)域處理器芯片的轉(zhuǎn)變。
基于這個趨勢,很多公司開啟了DSA的實踐,推出了針對特定領(lǐng)域應(yīng)用的DSA處理器,于是包括NPU、TPU、DPU、DSP等在內(nèi)的各種“XPU”應(yīng)運而生,盡管這些芯片類別不同,適用領(lǐng)域有所差異,但其作為專門為AI任務(wù)和特定領(lǐng)域需求而生的新芯片,它們都有著比通用計算功耗低、計算性能高、成本更低等優(yōu)勢。
不難判斷,定制化和異構(gòu)化DSA作為整個系統(tǒng)的算力中堅,將成為未來處理器架構(gòu)的趨勢,有望在下一代計算平臺中發(fā)揮更大的價值。
DSA大行其道,EDA亟待革新
不難理解,DSA的目標就是提升計算的能效比,更好地滿足特定領(lǐng)域SoC設(shè)計的差異化、能效比以及推向市場的時效性。
然而,AI時代在為DSA處理器應(yīng)用場景提供了更多可能性的同時,也對芯片研發(fā)的效率提出了更高的挑戰(zhàn)。
在DSA芯片公司實際的開發(fā)過程中,傳統(tǒng)的EDA工具存在費人、費時、費錢且風險大等問題。尤其在芯片行業(yè)如此“卷”的后摩爾時代,在專用處理器規(guī)模指數(shù)式上升和面市時間快速縮短的雙重壓力下,如何快速生成專用處理器,成倍提升處理器設(shè)計效率,加速產(chǎn)品迭代已然成為市場制勝的關(guān)鍵。
這也對EDA工具提出了新的要求。對此,芯易薈通過對行業(yè)需求的深刻理解以及專業(yè)知識和經(jīng)驗的長期累計,推出了一款賦能專用計算、具有顛覆性創(chuàng)新的EDA軟件工具——FARMStudio。
據(jù)芯易薈聯(lián)合創(chuàng)始人徐勇介紹,F(xiàn)ARMStudio是一款以C語言描述,基于RISC-V基礎(chǔ)指令集的專用處理器生成工具,針對密集計算和復(fù)雜數(shù)據(jù)處理的應(yīng)用場景,賦能工程師自由探索計算架構(gòu),優(yōu)化PPA,快速收斂至最佳設(shè)計。
該工具基于FARM設(shè)計方法學,參考DSA設(shè)計范式,可方便的針對不同應(yīng)用,進行不同架構(gòu)下處理器的性能探索,用戶僅需在軟件中輸入基礎(chǔ)核、超級指令、預(yù)置模板三項數(shù)據(jù),便可分鐘級自動生成符合使用者功能、性能描述的處理器硬件及軟件工具鏈,并提供相關(guān)FPGA開發(fā)驗證平臺。RTOS、相關(guān)數(shù)學庫及應(yīng)用層軟件包也可一并交付,可最大程度縮短產(chǎn)品上市時間,提高競爭力。
作為自動生成專用處理器的EDA平臺,F(xiàn)ARMStudio擁有諸多優(yōu)勢:
加速進程:分鐘級自動生成DSA處理器和配套工具鏈,可最大程度縮短產(chǎn)品上市時間,提高競爭力;
FARM多層級驗證:用C語言實現(xiàn)快速芯片設(shè)計,并全方位保障CtoRTL的正確性和一致性;
靈活高效:探索“左移”、決策“右移”,讓架構(gòu)探索和硬件設(shè)計更靈活,獲取最符合特定需求的DSA處理器;
自主可控:FARMStudio擁有完整的技術(shù)儲備和開放的生態(tài)圈,實現(xiàn)國產(chǎn)化、自主可控。
資源復(fù)用:自定義指令和預(yù)制指令資源復(fù)用
如徐勇所言,隨著芯片規(guī)模和芯片制造成本的指數(shù)級上升,芯片項目的決策不能等到芯片開發(fā)生產(chǎn)完成后再去做,而是需要在預(yù)研階段就能根據(jù)應(yīng)用需求做好軟硬件劃分和驗證,去實際評估最終能否達到性能需求。
相較于傳統(tǒng)設(shè)計流程中的決策往往伴隨著較大的不確定性,芯易薈升級設(shè)計流程,基于FARMStudio的設(shè)計并行化,通過將“軟硬協(xié)同、設(shè)計優(yōu)化、驗證”等流程左移,以及該工具分鐘級的快速響應(yīng),以此來幫助客戶降低決策風險,加快客戶研發(fā)速度。
而之所以能夠取得上述顛覆性優(yōu)勢的原因,徐勇在接受半導(dǎo)體行業(yè)觀察采訪時表示,首先我們是以創(chuàng)新為出發(fā)點,迫切的想要進行創(chuàng)新;此外,公司研發(fā)團隊實力強,由40多年行業(yè)經(jīng)驗的科學家領(lǐng)頭,團隊碩士及以上學歷人才占比達80%,且非常了解行業(yè)痛點和發(fā)展趨勢。
在此基礎(chǔ)上,芯易薈通過思維方法的整合,進行深度技術(shù)創(chuàng)新融合,實現(xiàn)了一系列技術(shù)的突破:
基于RISC-V基礎(chǔ)指令,無需微架構(gòu)知識,自主可控
基于C語言,軟硬件設(shè)計語言統(tǒng)一,全球首創(chuàng)
分鐘級自動生成DSA處理器和配套工具鏈
高性能編譯器,支持自動VLIW,自動流水線排布
多層次驗證環(huán)境,指令級別驗證在X86平臺實現(xiàn),世界唯一
周期精確仿真器,仿真速度達到MHz級別,業(yè)界最快
FPGA云開發(fā)測試環(huán)境,即插即用
嵌入式OS,自動配置
在諸多突破性技術(shù)和優(yōu)勢的加持下,F(xiàn)ARMStudio工具內(nèi)嵌面向豐富應(yīng)用場景的DSA設(shè)計范式,便于客戶快速集成、優(yōu)化和驗證DSA處理器,可廣泛應(yīng)用于定制針對視覺、AI、通信、音頻、DPU、工業(yè)控制等領(lǐng)域的處理器解決方案,助力芯片設(shè)計公司突破傳統(tǒng)IP能效上限,并以更低的成本適應(yīng)算法與產(chǎn)品的持續(xù)迭代。
對此,芯易薈市場總監(jiān)徐明以DSP和NPU兩個典型應(yīng)用方向為例,展現(xiàn)了使用FARM方法學研發(fā)DSA處理器的優(yōu)勢和靈活性。
其中,DSP作為目前芯片市場比較典型的處理器,特別適合快速地實現(xiàn)各種數(shù)字信號的處理和運算,己成為AI、計算機視覺、音頻等領(lǐng)域的關(guān)鍵核心。在研發(fā)DSP方面,F(xiàn)ARM方法學具有較大優(yōu)勢,使用FARMStudio工具,通過非標數(shù)據(jù)類型、個性化小數(shù)標定以及提煉典型應(yīng)用場景的算法需求,聚焦不同應(yīng)用方向提供靈活的可選組件來加速DSP的設(shè)計、開發(fā)及驗證流程。這其中也包括專用的加速指令,依托于強大的編譯器可以顯著提升性能和資源利用率。
徐明表示,相較于傳統(tǒng)的DSPIP,使用FARMStudio平臺能以更少的面積和功耗,更小的codesize,獲得更極致的性能,以滿足數(shù)字化時代處理密集型應(yīng)用的數(shù)據(jù)計算需求。
此外,通過FARM方法學研發(fā)NPU同樣存在諸多優(yōu)勢,包括應(yīng)用需求驅(qū)動NPU設(shè)計、不同架構(gòu)范式適配復(fù)雜應(yīng)用需求、支持非標數(shù)據(jù)類型、支持內(nèi)存架構(gòu)定制等,進而可以在幫助NPU芯片追求極致性能的同時,大幅縮減人力和時間成本。
“綜合來看,F(xiàn)ARM方法學靈活高效,降低數(shù)量級級別處理器開發(fā)成本;顛覆功能,突破傳統(tǒng)處理器IP能力邊界;自主可控,多種合作方式解決客戶處理器需求。”徐明總結(jié)道。
伴隨技術(shù)創(chuàng)新而來的,還有芯易薈對其商業(yè)模式的思考和重新定義。
據(jù)介紹,F(xiàn)ARMStudio工具分為企業(yè)版和個人版兩種類型,企業(yè)版支持軟件工具鏈、仿真器、SDK/OS、RTL下載、專家技術(shù)支持等功能;個人版則在企業(yè)版基礎(chǔ)上減少了RTL下載功能,專家技術(shù)支持調(diào)整為在線技術(shù)支持。
“相較于其他EDA/IP廠商動輒幾百上千萬的授權(quán)費用以及1%-2%甚至更高比例的版稅,F(xiàn)ARMStudio企業(yè)版采用1+1的定價模式,即EDA授權(quán)費100萬人民幣每年+1%的ASP版稅;更是發(fā)布個人版,僅需每年299人民幣,但不可用于商業(yè)用途。”徐勇補充道。
對于推出個人版的原因,徐勇強調(diào),EDA核心是用戶使用量,個人版一方面可以提高用戶使用量,解鎖個人對行業(yè)的了解,為生態(tài)培養(yǎng)貢獻力量;另一方面,可以借此來加速收集用戶反饋,為自身軟件的后續(xù)更新迭代做基礎(chǔ)。
綜合來看,作為一款以C語言描述,基于RISC-V基礎(chǔ)指令集的專用處理器生成工具,F(xiàn)ARMStudio知識產(chǎn)權(quán)自主,助力客戶高效積累自研IP是其核心競爭力所在。借此優(yōu)勢,F(xiàn)ARMStudio得以降低工程師使用門檻,提升工程師技能樹能級,自由探索架構(gòu),分鐘級優(yōu)化硬件,進而成倍提高芯片設(shè)計效率,為中國半導(dǎo)體事業(yè)添磚加瓦。
計算架構(gòu)黃金年代,國產(chǎn)EDA迎來拐點
眾所周知,隨著芯片設(shè)計的復(fù)雜程度不斷提升,EDA已經(jīng)滲透到芯片設(shè)計生產(chǎn)的各個環(huán)節(jié),EDA與產(chǎn)業(yè)鏈結(jié)合愈加緊密,已經(jīng)成為提高設(shè)計效率、加速技術(shù)進步的關(guān)鍵推手。
同時EDA杠桿效應(yīng)顯著,根據(jù)SEMI數(shù)據(jù),2021年全球EDA市場規(guī)模僅為132億美元,卻撬動著數(shù)千億美元的集成電路產(chǎn)業(yè),以及背后數(shù)十萬億規(guī)模的數(shù)字經(jīng)濟,其屬性和重要性可見一斑。
近年來,受地緣政治關(guān)系的影響,我國在包括EDA在內(nèi)的多個半導(dǎo)體領(lǐng)域面臨關(guān)鍵核心技術(shù)卡脖子的危機。因此,如何盡快打破壟斷,實現(xiàn)相關(guān)領(lǐng)域的“自主可控”成為全社會的廣泛共識。
2021年,工信部出臺的《“十四五”軟件和信息技術(shù)服務(wù)業(yè)發(fā)展規(guī)劃》中提出要重點突破工業(yè)軟件,EDA作為工業(yè)軟件的皇冠明珠,是短板所在,也是未來重點發(fā)力方向。
在此背景下,國產(chǎn)EDA廠商正卯足力氣、加緊追趕,芯易薈也是在這個過程中成立并逐步壯大,在專用計算領(lǐng)域?qū)崿F(xiàn)技術(shù)突破,解決了行業(yè)客戶在芯片實際開發(fā)過程中的一系列復(fù)雜挑戰(zhàn)和難題,顛覆了國外巨頭對EDA領(lǐng)域的長期壟斷。
FARMStudio工具目前已由國內(nèi)外多家IC廠商進行實踐測試及使用,應(yīng)用市場涵蓋手機、安防、汽車、通信、消費電子、工業(yè)控制等諸多領(lǐng)域,正在發(fā)展成為我國自主研發(fā)集成電路產(chǎn)業(yè)生態(tài)的重要部分。
徐勇表示,近年來,隨著更多政策加碼,相關(guān)技術(shù)正日益成熟,國產(chǎn)EDA企業(yè)正迎來發(fā)展的黃金期。我們也十分期待看到EDA產(chǎn)業(yè)日益加劇的市場競爭中,催生更多、更先進的國產(chǎn)EDA工具,共同助推中國集成電路產(chǎn)業(yè)的進一步發(fā)展。
作為芯片設(shè)計行業(yè)的賦能者,芯易薈自主研發(fā)專用處理器設(shè)計與驗證自動化的前瞻性技術(shù),提供處理器開發(fā)的一站式平臺,針對豐富的應(yīng)用場景,自動產(chǎn)生最佳匹配的軟硬件協(xié)同方案,為中國乃至全球范圍日益增長的芯片設(shè)計需求提供新型設(shè)計方法學、工具軟件和最佳實踐。
正如在文章開頭JohnHennessy和DavidPatterson提到的,計算機架構(gòu)正在迎來一個新的黃金時代。
對于芯易薈來說,這也是他們的一個機會。