


- 全勤獎(jiǎng)
- 節(jié)日福利
- 不加班
- 周末雙休
1、研發(fā)分布式訓(xùn)練加速方案,優(yōu)化ZeRO/FSDP/Pipeline并行策略,提升千億參數(shù)模型訓(xùn)練吞吐量;
2、設(shè)計(jì)混合精度訓(xùn)練與顯存優(yōu)化方案,開發(fā)自適應(yīng)梯度壓縮、通信優(yōu)化模塊,實(shí)現(xiàn)單卡訓(xùn)練模型規(guī)模提升和降低分布式訓(xùn)練通信開銷
開發(fā)量化壓縮工具鏈(支持GPTQ/AWQ等算法),實(shí)現(xiàn)模型8/4-bit無(wú)損量化部署;
3、設(shè)計(jì)多GPU推理調(diào)度策略,優(yōu)化顯存碎片管理與計(jì)算資源利用率;
4、跟進(jìn)vLLM/TensorRT-LLM/SGLang等前沿框架,探索MoE架構(gòu)/稀疏化訓(xùn)練等新型范式,將最新學(xué)術(shù)成果快速落地到工程實(shí)踐。
職位要求:
1、計(jì)算機(jī)科學(xué)/人工智能方向碩士及以上,3年LLM系統(tǒng)優(yōu)化經(jīng)驗(yàn);
2、精通PyTorch/TensorFlow框架底層機(jī)制,具備CUDA/C 內(nèi)核開發(fā)能力;
3、掌握Megatron-LM/DeepSpeed/HuggingFace生態(tài)核心原理;
4、有千億參數(shù)模型訓(xùn)練優(yōu)化或百萬(wàn)QPS推理服務(wù)落地經(jīng)驗(yàn);
5、熟悉NVIDIA GPU架構(gòu)與性能分析工具;
6、熟悉大模型推理服務(wù)架構(gòu)設(shè)計(jì)與微服務(wù)化部署。



-
IT服務(wù)·系統(tǒng)集成
-
500-999人
-
股份制企業(yè)
-
越城區(qū)曲屯路398號(hào)聯(lián)合大廈16層
-
眼科主任(遂寧) 12000-20000元應(yīng)屆畢業(yè)生 本科成都愛(ài)爾眼科醫(yī)院有限公司
-
視光部主任(遂寧) 15000-30000元應(yīng)屆畢業(yè)生 本科成都愛(ài)爾眼科醫(yī)院有限公司
-
教務(wù)主任 4000-6000元應(yīng)屆畢業(yè)生 本科成都市雙流區(qū)育英學(xué)校
-
CEO 助理(東區(qū)愛(ài)爾) 20000-30000元應(yīng)屆畢業(yè)生 本科成都愛(ài)爾眼科醫(yī)院有限公司
-
寫字樓高端禮賓 5元以上應(yīng)屆畢業(yè)生 不限成都利豐物業(yè)有限公司
-
學(xué)業(yè)咨詢師助理/全日制學(xué)校/社保 4000-6000元應(yīng)屆畢業(yè)生 大專成都市成華區(qū)新學(xué)八里教育培訓(xùn)學(xué)校有限責(zé)任公司