研電賽.
研電賽官方服務(wù)平臺(tái)
20th
“AMD”命題
第二十屆中國研究生電子設(shè)計(jì)競(jìng)賽
AMD成立于1969年,總部位于美國加州圣克拉拉,現(xiàn)已發(fā)展為全球領(lǐng)先的高性能與自適應(yīng)計(jì)算公司,全球員工超過28,000名(截至2025年3月)。公司產(chǎn)品涵蓋CPU、GPU、FPGA、DPU及系統(tǒng)級(jí)芯片,并結(jié)合強(qiáng)大的軟件能力,廣泛應(yīng)用于云端、邊緣和終端設(shè)備。
AMD致力于推動(dòng)人工智能發(fā)展,提供端到端的AI訓(xùn)練與推理解決方案,構(gòu)建開放生態(tài)系統(tǒng),并積極與中國生態(tài)伙伴合作,助力產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型。
中國是AMD全球戰(zhàn)略的重要市場(chǎng)。自1993年進(jìn)入中國以來,AMD不斷擴(kuò)大在華投入,業(yè)務(wù)涵蓋產(chǎn)品銷售、戰(zhàn)略合作、新品開發(fā)等。2004年成立大中華區(qū)總部,現(xiàn)由高級(jí)副總裁潘曉明領(lǐng)導(dǎo)。
2006年,AMD在上海設(shè)立研發(fā)中心,以上海研發(fā)中心為主體的中國研發(fā)中心逐漸發(fā)展壯大,現(xiàn)已成為全球研發(fā)體系的重要組成,擁有超4,000名研發(fā)人員,覆蓋芯片設(shè)計(jì)、軟件開發(fā)與系統(tǒng)測(cè)試,并與本地客戶緊密合作,推動(dòng)技術(shù)落地。近年來,AMD在AI創(chuàng)新與可持續(xù)發(fā)展方面表現(xiàn)突出,榮獲“2023年度杰出可持續(xù)創(chuàng)新企業(yè)”“2023-2024年度最受尊敬企業(yè)”稱號(hào),2024“世界互聯(lián)網(wǎng)大會(huì)杰出貢獻(xiàn)獎(jiǎng)”等多項(xiàng)榮譽(yù)。
一等獎(jiǎng):1名¥10,000
二等獎(jiǎng):2名¥5,000
三等獎(jiǎng):3名¥2,000
(一)報(bào)名截止時(shí)間:2025年7月15日24:00。
(二)作品提交截止時(shí)間:2025年7月20日24:00。
(三)報(bào)名方式:采用線下報(bào)名方式,報(bào)名截止前完成報(bào)名費(fèi)繳納,并將參賽作品打包壓縮,與線下報(bào)名表(見附件)、繳費(fèi)憑證一并發(fā)送至官方郵箱。建議優(yōu)先提交報(bào)名表,便于命題企業(yè)提供技術(shù)支持。
(四)報(bào)名郵箱:CIEEDA 163.COM
(五)繳費(fèi)賬號(hào)(線下轉(zhuǎn)賬):
1.開戶名稱:中國電子學(xué)會(huì)
2.賬號(hào):9558850200000514831
(六)其他:
1.7月15日?qǐng)?bào)名截止后,秘書處將組織團(tuán)隊(duì)在官網(wǎng)完善信息并生成獲獎(jiǎng)證書,電子發(fā)票將發(fā)至隊(duì)長(zhǎng)郵箱。
2.線下報(bào)名僅延長(zhǎng)截止時(shí)間,不影響其他賽程安排。
賽題一:
基于ROCm on Radeon?平臺(tái)的
DeepSeek大語言模型部署性能優(yōu)化
1、賽題描述:
隨著AMD ROCm軟件棧對(duì)RDNA3架構(gòu)支持的不斷完善,面向?qū)I(yè)及創(chuàng)意人士設(shè)計(jì)的AMD Radeon?PRO W7000系列工作站顯卡,憑借其卓越的48GB GDDR6顯存容量,正逐步成為應(yīng)對(duì)當(dāng)前AI開發(fā)面臨的嚴(yán)峻挑戰(zhàn)時(shí)有效且經(jīng)濟(jì)的解決方案。目前,ROCm搭配W7000系工作站GPU的組合已支持大部分業(yè)內(nèi)主流的模型以及部署框架。
本命題要求參與者在搭載單張W7000工作站GPU的平臺(tái)上優(yōu)化使用vLLM框架部署DeepSeek-R1-Distill-Qwen-7B模型的性能。
建議的優(yōu)化方向包括但不限于:
提升常見算子(如Elementwise、GEMM等)的執(zhí)行效率,并對(duì)部署管線中的算子進(jìn)行融合優(yōu)化。
ROCm on Radeon?對(duì)諸多量化方法(如AWQ、Marlin等)提供支持。
對(duì)算法使用的計(jì)算內(nèi)核(如Attention、MoE等)進(jìn)行優(yōu)化。
2、提交要求:
參賽者應(yīng)基于指定代碼倉庫(如vLLM、PyTorch、Triton等)進(jìn)行代碼更改,經(jīng)本地編譯驗(yàn)證后提交code patch,并附上本地測(cè)試結(jié)果顯示的性能提升幅度。性能提升基于代碼改正,而非依靠部署參數(shù)調(diào)整。具體參數(shù)參見技術(shù)支持部分。
3、評(píng)分標(biāo)準(zhǔn):
所有提交的代碼將統(tǒng)一在ROCm on Radeon?平臺(tái)上進(jìn)行驗(yàn)證,并根據(jù)性能提升的幅度進(jìn)行排名。
基礎(chǔ)得分=優(yōu)化幅度百分比x 100
加分項(xiàng):(由AMD評(píng)審團(tuán)打分)
創(chuàng)新性(5分):優(yōu)化方案的原創(chuàng)程度及復(fù)雜程度。
實(shí)用性(5分):優(yōu)化方案對(duì)ROCm生態(tài)推廣的積極作用。
可讀性(2分):提交優(yōu)化方案的詳細(xì)闡述文檔或PPT。
4、硬件平臺(tái)配置:
(報(bào)名審核后,通知云服務(wù)申請(qǐng)表)
5、視頻教程:
在8卡AMD W7800運(yùn)行DeepSeek R1鏈接:
https://www.bilibili.com/video/BV1i8j3zJExM
6、本地開發(fā)環(huán)境:
推薦使用AMD Radeon?PRO W7800
7、技術(shù)支持:
掃描二維碼加入技術(shù)支持QQ群:
8、軟件環(huán)境:
Benchmark教程(以修改vLLM為例)
(1)準(zhǔn)備DeepSeek-R1-Distill-Qwen-7B模型和ShareGPT_V3_unfiltered_cleaned_split.json數(shù)據(jù)集
(2)推薦使用PyTorch-On-ROCm Docker Image創(chuàng)建container。
(3)在container內(nèi)安裝帶有本地修改的vLLM。
(4)啟動(dòng)vLLM server
(1)運(yùn)行benchmark并觀測(cè)結(jié)果
9、相關(guān)鏈接:
AMD Radeon?PRO W7800 Professional Graphics Specification:
https://www.amd.com/en/products/graphics/workstations/radeon-pro/w7800.html
Getting Started Guide:Using AMD ROCm?Software on Radeon?GPUs:
https://www.amd.com/en/developer/resources/ml-radeon.html
Inferencing and serving with vLLM on AMD GPUs:
https://rocm.blogs.amd.com/artificial-intelligence/vllm/README.html
賽題二:基于AMD APU系統(tǒng)的AI應(yīng)用開發(fā)(自由命題)
1.賽題描述:
AIPC(人工智能個(gè)人電腦)是一種集成AI技術(shù)的個(gè)人電腦,通過本地算力、自然語言交互、個(gè)性化大模型等核心能力,重構(gòu)傳統(tǒng)PC的體驗(yàn),使其從工具升級(jí)為“個(gè)人智能助理”。
參賽隊(duì)伍使用AMD指定的APU產(chǎn)品開發(fā)一個(gè)AI應(yīng)用,圍繞以下領(lǐng)域(包括但不限于):
AI應(yīng)用專業(yè)領(lǐng)域
AI應(yīng)用日常生活?yuàn)蕵?/span>
AI PC與其他智能設(shè)備的鏈接與整合
補(bǔ)充說明:
(1)AIPC本地模型優(yōu)化方案:針對(duì)AI Agent等現(xiàn)有應(yīng)用,提出優(yōu)化其在AIPC本地運(yùn)行效能的創(chuàng)新方案(可融合大預(yù)言模型LLM、計(jì)算機(jī)視覺CV、文本處理OCR、語音交互ASR等):
a.模型輕量化:應(yīng)用模型壓縮技術(shù)(量化、蒸餾、剪枝等),實(shí)現(xiàn)模型精簡(jiǎn)與本地適配,兼顧精度。
評(píng)分依據(jù):優(yōu)化前后模型大小、推理性能、系統(tǒng)負(fù)載數(shù)據(jù)對(duì)比。
b.推理加速:采用優(yōu)化技術(shù)(算子、圖結(jié)構(gòu)、內(nèi)存管理等),提升本地推理效率(如prefill、token generation速度)。
評(píng)分依據(jù):性能提升量化數(shù)據(jù)。
(2)行業(yè)賦能方案:為教育、醫(yī)療、娛樂、辦公等場(chǎng)景,設(shè)計(jì)基于AIPC本地AI的創(chuàng)新應(yīng)用(例如:作業(yè)批改、病例分析、文章潤(rùn)色)。
評(píng)分核心:創(chuàng)新性、實(shí)用性、可行性。
(3)其他
2、賽題要求:
2.1硬件環(huán)境
AIPC云平臺(tái)接入(報(bào)名審核后,通知云服務(wù)申請(qǐng)表)
型號(hào):Beelink SER/處理器:AMD Ryzen HX370/內(nèi)存:32GB RAM/存儲(chǔ):1TB SSD
操作系統(tǒng):Windows 11
外設(shè)請(qǐng)根據(jù)AI應(yīng)用設(shè)計(jì)自行配置
2.2 AI應(yīng)用的設(shè)計(jì)與實(shí)現(xiàn)
基于所提供的硬件環(huán)境,以及利用AMD推薦模型https://huggingface.co/amd或者自選模型,完成所選場(chǎng)景下的AI應(yīng)用開發(fā)。
參賽作品須提出創(chuàng)新的解決方案,展示其前瞻性的思考和設(shè)計(jì)。
參賽作品須具有實(shí)際的應(yīng)用價(jià)值。
參賽作品須充分發(fā)揮AMD產(chǎn)品的算力優(yōu)勢(shì)(iGPU,NPU,CPU)實(shí)現(xiàn)本地AI推理。
加分項(xiàng):充分利用本地AI算力前提下,提升電源利用能效。
2.3賽題提交要求(初賽)
技術(shù)論文–Word文檔(必選)
視頻文件,限制3分鐘(必選)
門型展架,尺寸180cm*80cm(必選)
演示說明–PPT文檔(可選)
2.4賽題提交要求(決賽)
技術(shù)論文–Word文檔(必選)
演示說明–PPT文檔(必選)
3、評(píng)分標(biāo)準(zhǔn):
3.1技術(shù)創(chuàng)新和實(shí)用性30%
AI應(yīng)用基于的模型(或模型組)
提出創(chuàng)新的解決方案
能夠有效地解決現(xiàn)實(shí)世界中的問題
復(fù)雜度和計(jì)算效率
示例:一個(gè)使用深度學(xué)習(xí)技術(shù)進(jìn)行圖像分類的模型,若其準(zhǔn)確率超過90%且計(jì)算速度快于現(xiàn)有方法,則會(huì)得高分。
3.2 AI應(yīng)用程序與用戶交互程度20%
示例:一個(gè)語音助手模型,若能根據(jù)用戶的口音和語調(diào)自適應(yīng),并提供直觀的界面,則會(huì)得高分。
3.3論文,PPT的清晰度與邏輯20%
文獻(xiàn)綜述全面、正確
方法描述清晰、易于理解
結(jié)果分析合理、令人信服
3.4功能完整度+穩(wěn)定性15%
完成所有預(yù)定任務(wù)
運(yùn)行速度和穩(wěn)定性
示例:一個(gè)文本生成模型,若其能生成高質(zhì)量文本且運(yùn)行速度快、穩(wěn)定,則會(huì)得高分。
3.5 Demo(現(xiàn)場(chǎng)直播、預(yù)先錄制視頻等形式)10%
清晰展示該應(yīng)用的功能和性能
可以幫助用戶輕松理解和使用該應(yīng)用
示例:一個(gè)人臉識(shí)別模型,若其Demo能快速、準(zhǔn)確識(shí)別人臉并提供友好界面,則會(huì)得高分。
3.6用戶隱私數(shù)據(jù)是否受到保護(hù)5%
是否收集和存儲(chǔ)用戶的隱私數(shù)據(jù)
用戶的本地隱私數(shù)據(jù)是否加密
是否會(huì)將本地存儲(chǔ)的隱私數(shù)據(jù)上傳到網(wǎng)絡(luò)
是否有明確的隱私政策和使用條款
示例:一個(gè)社交媒體分析模型,若其在不收集用戶隱私數(shù)據(jù)的情況下完成分析,并提供清晰的隱私政策,則會(huì)得高分。
4、參考鏈接:
?AMD AI Solutions:
https://www.amd.com/en/solutions/ai.html
?AMD HIP SDK on Windows:
https://rocm.docs.amd.com/projects/install-on-windows/en/latest/index.html
?AMD Ryzen AI:
https://ryzenai.docs.amd.com/en/latest/index.html
5、賽題-競(jìng)賽交流QQ群:
點(diǎn)擊閱讀原文下載報(bào)名表
https://mp.weixin.qq.com/s/nXOwdLGW0qO8aEyVg22STQ