職位描述
該職位還未進行加V認證,請仔細了解后再進行投遞!
工作職責:
1. 大模型研發(fā)與迭代:負責語言大模型(LLM)或多模態(tài)大模型(VLM)的預訓練、微調(diào)(SFT/RLHF/DPO)、對齊(Alignment)及性能優(yōu)化,提升模型在指令遵循、推理、代碼生成等任務的表現(xiàn)。
2. 探索模型架構創(chuàng)新,包括MoE(混合專家)、長上下文(Long Context)、Scaling Law等前沿方向,推動訓練效率與效果突破。
673. 前沿技術研究與應用:跟蹤并復現(xiàn)LLM/VLM領域頂會成果(如CVPR、NeurIPS、ICLR等),主導開源項目貢獻,發(fā)表高水平論文或專利。
4. 研發(fā)多模態(tài)對齊、視頻-語音交互、Agent規(guī)劃等關鍵技術,構建跨模態(tài)理解與生成能力。
675. 數(shù)據(jù)與訓練流程優(yōu)化:設計數(shù)據(jù)配比策略,構建高質(zhì)量訓練數(shù)據(jù)集,研究數(shù)據(jù)增強、合成及清洗方法,推動Data-Centric閉環(huán)。優(yōu)化從數(shù)據(jù)生產(chǎn)到模型訓練的全流程,熟悉Deepspeed、Megatron等分布式訓練框架。
676. 模型評測與落地支持:開發(fā)評測工具與平臺,設計細粒度評估指標,分析模型異常表現(xiàn)并提出改進方案。
7. 參與技術成果轉化,支持智能客服、內(nèi)容生成、智能體(Agent)等業(yè)務場景落地。
任職資格:
1. 67教育背景:碩士及以上學歷,計算機科學、人工智能、數(shù)學等相關專業(yè),博士優(yōu)先。
2. 67技術能力:熟練掌握PyTorch/TensorFlow框架,具備CUDA優(yōu)化或大模型訓練經(jīng)驗者優(yōu)先。
3. 扎實的算法基礎,熟悉Transformer架構、強化學習(RLHF/RLAIF)及多模態(tài)融合技術。
674. 科研與實踐經(jīng)驗:以***作者在頂會(ACL、CVPR等)發(fā)表論文,或在國際競賽(Kaggle、KDD Cup等)中取得前5%排名者優(yōu)先。
5. 具備大模型訓練、開源項目貢獻、智能體系統(tǒng)開發(fā)等經(jīng)驗者優(yōu)先。
6. 67綜合素質(zhì):目標導向,具備獨立科研能力與創(chuàng)新思維,能快速定位技術瓶頸并提出解決方案。
7. 優(yōu)秀的英文讀寫能力,擅長跨團隊協(xié)作,適應快節(jié)奏研發(fā)環(huán)境。
1. 大模型研發(fā)與迭代:負責語言大模型(LLM)或多模態(tài)大模型(VLM)的預訓練、微調(diào)(SFT/RLHF/DPO)、對齊(Alignment)及性能優(yōu)化,提升模型在指令遵循、推理、代碼生成等任務的表現(xiàn)。
2. 探索模型架構創(chuàng)新,包括MoE(混合專家)、長上下文(Long Context)、Scaling Law等前沿方向,推動訓練效率與效果突破。
673. 前沿技術研究與應用:跟蹤并復現(xiàn)LLM/VLM領域頂會成果(如CVPR、NeurIPS、ICLR等),主導開源項目貢獻,發(fā)表高水平論文或專利。
4. 研發(fā)多模態(tài)對齊、視頻-語音交互、Agent規(guī)劃等關鍵技術,構建跨模態(tài)理解與生成能力。
675. 數(shù)據(jù)與訓練流程優(yōu)化:設計數(shù)據(jù)配比策略,構建高質(zhì)量訓練數(shù)據(jù)集,研究數(shù)據(jù)增強、合成及清洗方法,推動Data-Centric閉環(huán)。優(yōu)化從數(shù)據(jù)生產(chǎn)到模型訓練的全流程,熟悉Deepspeed、Megatron等分布式訓練框架。
676. 模型評測與落地支持:開發(fā)評測工具與平臺,設計細粒度評估指標,分析模型異常表現(xiàn)并提出改進方案。
7. 參與技術成果轉化,支持智能客服、內(nèi)容生成、智能體(Agent)等業(yè)務場景落地。
任職資格:
1. 67教育背景:碩士及以上學歷,計算機科學、人工智能、數(shù)學等相關專業(yè),博士優(yōu)先。
2. 67技術能力:熟練掌握PyTorch/TensorFlow框架,具備CUDA優(yōu)化或大模型訓練經(jīng)驗者優(yōu)先。
3. 扎實的算法基礎,熟悉Transformer架構、強化學習(RLHF/RLAIF)及多模態(tài)融合技術。
674. 科研與實踐經(jīng)驗:以***作者在頂會(ACL、CVPR等)發(fā)表論文,或在國際競賽(Kaggle、KDD Cup等)中取得前5%排名者優(yōu)先。
5. 具備大模型訓練、開源項目貢獻、智能體系統(tǒng)開發(fā)等經(jīng)驗者優(yōu)先。
6. 67綜合素質(zhì):目標導向,具備獨立科研能力與創(chuàng)新思維,能快速定位技術瓶頸并提出解決方案。
7. 優(yōu)秀的英文讀寫能力,擅長跨團隊協(xié)作,適應快節(jié)奏研發(fā)環(huán)境。
工作地點
地址:深圳寶安區(qū)庭威產(chǎn)業(yè)園-2號樓1B2樓D區(qū)
??
點擊查看地圖
詳細位置,可以參考上方地址信息
求職提示:用人單位發(fā)布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業(yè)證等),均涉嫌違法,請求職者務必提高警惕。

深圳
應屆畢業(yè)生
博士
2026-02-27 20:14:18
813人關注
注:聯(lián)系我時,請說是在河北人才網(wǎng)上看到的。
