99AV天堂网站|亚洲一级特黄毛片|99久久久金莲tv|人妻+无码+中字|夜夜春天天看天天爽|AV黄色在线播放|91成人无码国产在线观看|久久久久久久wav|国产精品v视频久久丁香国产精品|日本外围在线观看

大模型高效系統(tǒng)推理工程師

面議
深圳 碩士研究生 若干人 2025-04-09發(fā)布 查看公告詳情
查看公告詳情
聲明:本站部分公告與職位內(nèi)容由本站根據(jù)官方招聘公告進(jìn)行整理編輯。由于用人單位需求專業(yè)、學(xué)歷學(xué)位、資格條件、職位編制、備注內(nèi)容等內(nèi)容情況復(fù)雜且有變化可能,是否符合招聘條件以用人單位公告為準(zhǔn)或請聯(lián)系用人單位確認(rèn)。本站整理編輯的職位信息僅供求職者參考,如因此造成的損失本站不承擔(dān)任何責(zé)任!
職位詳情
基本信息
職位名稱:大模型高效系統(tǒng)推理工程師
工作地點(diǎn):廣東深圳
招聘人數(shù): 若干
報(bào)名方式: 站內(nèi)投遞
截止時(shí)間:詳見正文
其他要求
學(xué)歷要求:碩士研究生
該需求專業(yè)僅展示一級學(xué)科
崗位職責(zé)
●針對端(手機(jī)/智能終端設(shè)備)、邊(邊緣智能盒)、云(數(shù)據(jù)中心)的異構(gòu)算力環(huán)境(CPU/GPU/NPU等),按照項(xiàng)目需求設(shè)計(jì)并構(gòu)建高效的大語言模型(LLM)、多模態(tài)模型專屬推理系統(tǒng)。
●針對大模型推理效率及成本進(jìn)行優(yōu)化,解決算力堵點(diǎn)、優(yōu)化緩存效率、動態(tài)降低模型推理時(shí)的計(jì)算冗余,實(shí)現(xiàn)低成本的大模型推理部署。
●與算法團(tuán)隊(duì)緊密協(xié)作,將大語言模型、多模態(tài)模型(如圖文理解、語音交互等)集成到推理系統(tǒng)中,優(yōu)化模型在實(shí)際場景中的推理效率(如模型量化、剪枝、異構(gòu)算子優(yōu)化)。
●編寫系統(tǒng)設(shè)計(jì)文檔、技術(shù)方案與代碼注釋,確保推理系統(tǒng)的可維護(hù)性、可擴(kuò)展性及標(biāo)準(zhǔn)化交付。
任職要求
(一)基本條件
●碩士及以上學(xué)歷,計(jì)算機(jī)科學(xué)、軟件工程、電子工程等相關(guān)專業(yè)。
●5年以上高性能計(jì)算、模型推理系統(tǒng)研發(fā)經(jīng)驗(yàn),有大語言模型/多模態(tài)模型部署、異構(gòu)算力優(yōu)化、端邊云協(xié)同項(xiàng)目經(jīng)驗(yàn)者優(yōu)先。
(二)專業(yè)技能
●熟悉大語言模型(如GPT系列、LLaMA、BERT)和多模態(tài)模型(如StableDiffusion、CLIP)的推理原理及優(yōu)化方法,具備模型輕量化(量化、剪枝、蒸餾)和加速部署經(jīng)驗(yàn)。
●精通DNN高性能推理計(jì)算框架(如TensorRT、ONNXRuntime、MNN、TNN),掌握CUDA/CuDNN、OpenCL、ARMNEON等異構(gòu)編程技術(shù),能針對CPU/GPU/NPU等硬件特性優(yōu)化推理算子。
●熟悉分布式推理架構(gòu)(如DeepSpeed、Megatron-LM推理優(yōu)化),掌握模型并行、數(shù)據(jù)并行、流水并行等分布式策略,具備大規(guī)模集群推理系統(tǒng)調(diào)優(yōu)經(jīng)驗(yàn)。
●了解端邊云協(xié)同技術(shù)(如邊緣計(jì)算框架KubeEdge、云原生平臺K8s/Docker),熟悉邊緣設(shè)備(如智能攝像頭、工業(yè)網(wǎng)關(guān))的算力約束與部署要求。
(三)工具與框架
●有開源推理框架(如ONNXRuntime、TritonInferenceServer)貢獻(xiàn)經(jīng)驗(yàn)或大規(guī)模模型推理系統(tǒng)落地案例。
●具備語音識別、圖像生成等多模態(tài)任務(wù)的端邊云協(xié)同推理實(shí)戰(zhàn)經(jīng)驗(yàn)。
●熟熟練使用Python/C++,具備高性能代碼開發(fā)能力;熟悉PyTorch/TensorFlow等深度學(xué)習(xí)框架的推理部署流程。
●對算力資源調(diào)度(如任務(wù)分配、資源隔離)有實(shí)踐經(jīng)驗(yàn),熟悉容器化部署與Serverless推理架構(gòu)。
(四)能力素質(zhì)
●具備復(fù)雜系統(tǒng)問題分析能力,能快速定位異構(gòu)算力環(huán)境下的推理性能瓶頸并設(shè)計(jì)優(yōu)化方案。
●有強(qiáng)烈的技術(shù)探索精神,關(guān)注大模型推理前沿技術(shù)(如稀疏推理、動態(tài)圖優(yōu)化、近似計(jì)算),具備創(chuàng)新落地能力。
●良好的團(tuán)隊(duì)協(xié)作與跨領(lǐng)域溝通能力,能與算法、硬件、產(chǎn)品團(tuán)隊(duì)高效配合,推動技術(shù)方案落地。
●具備嚴(yán)謹(jǐn)?shù)墓こ趟季S,重視代碼質(zhì)量與系統(tǒng)可維護(hù)性,熟悉CI/CD流程與DevOps工具鏈。
競爭力分析
解鎖詳細(xì)分析
您與該職位匹配度: ***,已超過了 *** 的競爭者,建議************
較低
一般
比較匹配
非常匹配
歡迎掃描下方二維碼關(guān)注高校人才網(wǎng)官方微信(碩博QQ交流群:748436790 ,進(jìn)微信群請點(diǎn)擊添加官方客服號
重要風(fēng)險(xiǎn)提示:如招聘單位在招聘過程中向求職者提出收取押金、保證金、體檢費(fèi)、材料費(fèi)、成本費(fèi),或指定醫(yī)院體檢等,求職者有權(quán)要求招聘單位出具物價(jià)部門批準(zhǔn)的收費(fèi)許可證明材料,若無法提供相關(guān)證明,請求職者提高警惕,有可能屬于詐騙或違規(guī)行為。
高校人才網(wǎng)
百萬碩博人的擇業(yè)平臺
高校直招
5000+單位官方入駐
簡歷直投
30W+職位一鍵投遞
{{applyDialogData.systemTips}}
{{applyDialogData.resumeTips}}
+ 上傳
+ 上傳文件
立即續(xù)費(fèi)
{{successContentUp}}
{{successContentDown}}
我知道了
{{ title }}
{{tips1}}
{{tips2}}
{{ title }}
{{tips1}}
{{tips2}}
{{ title }}
{{tips1}}
{{tips2}}
{{ title }}
職位投遞成功!
微信掃碼關(guān)注【高校人才網(wǎng)服務(wù)號】

求職效率翻倍

實(shí)時(shí)接收投遞反饋
精彩活動搶先知曉
為你推薦
TOP