廣告

一種新的硬件加速器編程語言

2022-07-13 12:48:32 MIT 閱讀:
美國麻省理工學院計算機科學與人工智能實驗室(CSAIL)研究人員創建了一種名為“Exo”的新編程語言,用于在硬件加速器上編寫高性能代碼。Exo可以幫助初級性能工程師將簡單程序轉換為復雜程序,以在加速器芯片上運行,從而將程序運算的速度提高幾個數量級。目前,谷歌、蘋果和英偉達的加速器設施均通過加速目標程序的“關鍵子程序”、內核或高性能計算(HPC)子進程來為科學計算和機器學習應用提供動力。而Exo語言有望為這些工作提供更優化的性能。

在編程加速器時(應用程序將某些任務卸載到系統硬件,特別是為了加速該任務),您必須構建一個全新的軟件支持。硬件加速器可以以比CPU快幾個數量級的速度運行某些任務,但它們不能開箱即用。軟件需要有效地使用加速器的指令,使其與整個應用系統兼容,這意味著維護新芯片的工作量非常大。wFFednc

現在,麻省理工學院計算機科學與人工智能實驗室 (CSAIL) 的科學家創建了一種名為“Exo”的新編程語言,用于在硬件加速器上編寫高性能代碼。Exo 幫助低級性能工程師將指定他們想要計算的非常簡單的程序轉換為非常復雜的程序,這些程序與規范執行相同的操作,但通過使用這些特殊的加速器芯片要快得多。例如,工程師可以使用 Exo 將簡單的矩陣乘法轉換為更復雜的程序,通過使用這些特殊的加速器,該程序的運行速度提高了幾個數量級。wFFednc

與其他編程語言和編譯器不同,Exo 是圍繞一個稱為“Exocompilation”的概念構建的。“傳統上,許多研究都集中在自動化特定硬件的優化過程上,”博士 Yuka Ikarashi 說。電氣工程和計算機科學專業的學生,??CSAIL 附屬機構,他是有關 Exo 的新論文的主要作者。“這對大多數程序員來說都很好,但對于性能工程師來說,編譯器會經常出現問題,因為它有幫助。因為編譯器的優化是自動的,所以當它做錯事并給你 45% 的時候,沒有好的方法可以修復它效率而不是 90%。”wFFednc

借助 Exocompilation,性能工程師重新回到了駕駛座上。選擇應用哪些優化、何時以及以何種順序從編譯器外部化的責任返回給性能工程師。這樣,他們一方面不必浪費時間與編譯器抗爭,另一方面也不必手動完成所有工作。同時,Exo 負責確保所有這些優化都是正確的。因此,性能工程師可以花時間提高性能,而不是調試復雜的優化代碼。wFFednc

康奈爾大學計算機科學系助理教授 Adrian Sampson 說:“Exo 語言是一種在其目標硬件上參數化的編譯器;同一個編譯器可以適應許多不同的硬件加速器。” “Exo 無需編寫一堆雜亂的 C++ 代碼來編譯新的加速器,而是為您提供了一種抽象、統一的方式來寫下您想要定位的硬件的‘形狀’。然后您可以重用現有的 Exo 編譯器來適應新的描述,而不是從頭開始編寫全新的東西。這樣的工作的潛在影響是巨大的:如果硬件創新者可以不再擔心為每個新硬件創意開發新編譯器的成本,他們就可以嘗試并發布更多創意.wFFednc

當今制造的最高性能計算機芯片,例如 Google 的 TPU、Apple 的神經引擎或 NVIDIA 的 Tensor Cores,通過加速稱為“關鍵子程序”、內核或高性能計算 (HPC) 的東西來為科學計算和機器學習應用程序提供動力。 ) 子程序。wFFednc

除了笨拙的行話,這些程序是必不可少的。例如,稱為基本線性代數子程序 (BLAS) 的東西是一個“庫”或此類子程序的集合,專門用于線性代數計算,并支持許多機器學習任務,如神經網絡、天氣預報、云計算和藥物發現. (BLAS 非常重要,以至于它在 2021 年為 Jack Dongarra 贏得了圖靈獎。)然而,這些需要數百名工程師設計的新芯片只能在這些 HPC 軟件庫允許的范圍內發揮作用。wFFednc

但是,目前這種性能優化仍然是手動完成的,以確保這些芯片上的每個最后一個計算周期都被使用。HPC 子程序經常以超過 90% 的峰值理論效率運行,硬件工程師不遺余力地為這些理論峰值額外增加 5% 或 10% 的速度。因此,如果軟件沒有進行積極的優化,那么所有的辛勤工作都會被浪費掉——這正是 Exo 幫助避免的。wFFednc

Exocompilation 的另一個關鍵部分是性能工程師可以描述他們想要優化的新芯片,而無需修改編譯器。傳統上,硬件接口的定義由編譯器開發人員維護,但對于大多數這些新的加速器芯片,硬件接口是專有的。公司必須維護自己的整個傳統編譯器的副本(分叉),經過修改以支持他們的特定芯片。除了性能工程師之外,這還需要雇用編譯器開發人員團隊。wFFednc

“在 Exo 中,我們將特定于硬件的后端的定義從 exocompiler 外部化。這使我們能夠更好地將 Exo(一個開源項目)和特定于硬件的代碼(通常是專有的)分開。我們已經展示了“我們可以使用 Exo 快速編寫與英特爾手動優化的數學內核庫一樣高性能的代碼。我們正在積極與多家公司的工程師和研究人員合作,”加州大學伯克利分校的博士后 Gilbert Bernstein 說。wFFednc

Exo 的未來需要探索一種更高效的調度元語言,并擴展其語義以支持并行編程模型,從而將其應用于更多的加速器,包括 GPU。wFFednc

原文鏈接:A programming language for hardware acceleratorswFFednc

責編:Demi
  • 微信掃一掃
    一鍵轉發
  • 最前沿的電子設計資訊
    請關注“電子技術設計微信公眾號”
  • GaN是否可靠? GaN產業已經建立一套方法來保證GaN產品的可靠性,因此問題并不在于“GaN是否可靠?”,而是“如何驗證GaN的可靠性?”
  • 華為天才少年稚暉君用108天打了個字,重新定義客制化鍵 自稱“鴿王”的稚暉君終于更新啦。這次他帶來的新項目則是:一把完全客制化、帶屏幕模塊的機械鍵盤!有網友表示,稚暉君的這個新項目,為鍵圈乃至整個鍵盤行業提供了新的設計思路,甚至有望改變目前客制化以換殼為本的囧境。
  • 因眼睛小車主被輔助駕駛誤判“開車睡覺”,小鵬、蔚來回 昨日,汽車博主@常巖CY 發博稱自己突然上了熱搜,原來就是因自己眼睛小被小鵬汽車自動駕駛誤判“開車睡覺”,不住的發出提醒。此外,@常巖CY 稱在多款車型上都收到此困擾。無論是紅外還是攝像頭,只要開始檢測眼睛,就會判定過度疲勞。小鵬P7會提示他睡覺,蔚來ET7一開車就認為其疲勞和走神,嵐圖FREE會在冬天為了讓其“別困”而打開冷風……
  • 蘋果iPhone 14 Pro、iPhone 14 Pro Max 將采用更快的 隨著iPhone 14系列發布的臨近,iPhone 14系列的內存供應商也被曝光。一份由DigiTimes發表的報道顯示,今年晚些時候到達的"Pro"型號將配備6GB LPDDR5內存,這比當前一代的iPhone 13 Pro和iPhone 13 Pro Max都有6GB LPDDR4X內存提升了一代。
  • 國際象棋機器人Chessrobot夾斷對手手指,意外還是設計缺 據悉,在7月19日的莫斯科國際象棋公開賽期間,一位7歲小男孩疑似因提前走子犯規手,意外被“對手”國際象棋機器人Chessrobot夾住手指,造成指骨骨折,該事件登上了熱搜榜。該男孩是莫斯科9歲以下最強的30位棋手之一。
  • 蘋果芯片專家被三星挖走,擔任新封裝解決方案中心總監 在蘋果擴張自研芯片版圖的同時,也有半導體公司從蘋果“挖”半導體專家,三星就是其中之一。據韓國商務部的一則消息指出,一位在蘋果工作了九年的芯片專家離開了公司,加入了三星。
  • EA?Elektro-Automatik代表與中國駐德大使共商中國市 EA?Elektro-Automatik受邀參加主題為“變革中的貿易?不確定性時代的中德經濟關系展望”的高層外貿戰略論壇,為公司在中國市場實現重要增長進行規劃并奠定基礎。
  • 三星正式發貨第一批 3nm GAA 芯片 25日,三星電子在京畿道華城校區的V1線(僅限EUV)舉行了使用下一代晶體管GAA(Gate All Around)技術的3nm代工產品出貨儀式,這也意味著三星超越臺積電成為第一家 3nm 芯片制造商。
  • 碳化硅電力電子應用不止于汽車 第三代寬禁帶半導體——碳化硅(SiC)——正在發揮其眾所周知的潛力,在過去五年內,汽車行業一直是該材料的公開試驗場。然而,電氣化議程不會以汽車開始和結束。更廣泛的運輸應用將很快出現,包括卡車和公共汽車、船舶和航運、火車的進一步電氣化,甚至飛機。在供電方面,并網太陽能發電系統和通過高壓直流鏈路傳輸能源,對于低碳能源的生產和分配也至關重要。
  • 拆解一個中國產的“樹莓派”開發筆記本,售價279美元值 “樹莓派”在全球市越來越受歡迎,甚至有家長開始讓孩子用樹莓派學習開發產品。有中國廠商嗅到,率先開發出了基于“樹莓派”筆記本——CrowPi L ,外觀看和普通筆記本差不多, 但卻是基于樹莓派Raspberry Pi 4B 開發板的套件,專為 STEM 教育而設計,帶有可選的電子模塊和教程。EDN發現有外媒對其進行了拆解,接下來將這篇拆解文章分享給大家:
  • 林志穎駕特斯拉出車禍:特斯拉回應起火原因不明,網友質疑 據EDN電子技術設計了解,7月22日上午10時50分左右,林志穎駕駛特斯拉Model X,在路口處掉頭后加速向前行駛,但在前方道路分叉口處,因不明原因突然偏離車道自撞指示桿,整輛車陷入火海。此事引起網友關注熱議,特斯拉客服表示,暫不清楚起火原因,但車身沒有特別容易起火的材質。但有臺媒指出,林志穎最愛特斯拉的自動駕駛功能,這也引起了網友對事故是否與自動駕駛有關的猜測。
  • 售價將超50萬美元,喬布斯的Apple-1原型機電路板長什么 這塊在 1976 年由史蒂夫-沃茲尼亞克手工焊接的 Apple Computer A 印刷電路板被史蒂夫-喬布斯用來向保羅-特雷爾演示 Apple-1 電腦,后者是加州山景城 The Byte Shop 的老板。這臺原型機在“蘋果車庫”里保存了很多年,然后在大約 30 年前由史蒂夫-喬布斯交給了它現在的主人。當時,喬布斯已被蘋果公司趕走。喬布斯當時認為這個原型不是要供奉的東西,而是要被重新利用的東西。
廣告
熱門推薦
廣告
廣告
EE直播間
在線研討會
廣告
廣告
面包芯語
廣告
向右滑動:上一篇 向左滑動:下一篇 我知道了
激情亚洲av无码日韩色 嗯嗯~,女生~哦~自慰~啊啊~舒服 国产AV人人夜夜澡人人爽 手机在线看永久av片免费 欧美色播 中年熟妇精品BBBB