職位描述
該職位還未進行加V認證,請仔細了解后再進行投遞!
### **崗位名稱**
**大模型后端接口開發(fā)工程師**
**薪資范圍:** 25K-45K/月(能力定薪,優(yōu)秀者面議)
**工作地點:** 北京/上海/深圳/杭州(可談遠程協作)
---
### **崗位職責**
1. 設計與開發(fā)大語言模型(LLM)后端API接口,支撐億級用戶請求的高并發(fā)場景
2. 優(yōu)化大模型推理服務性能,通過分布式架構、量化壓縮等技術降低服務延遲與成本
3. 構建自動化監(jiān)控體系,保障接口服務的穩(wěn)定性(SLA 99.99%)
4. 設計鑒權、限流、負載均衡等安全防護機制,保障企業(yè)級服務安全
5. 與算法團隊緊密協作,推動模型版本迭代與接口服務的無縫升級
---
### **任職要求**
**核心技能:**
- 3年以上后端開發(fā)經驗,精通Python/Go/Java中的至少一門語言
- 深入理解RESTful/gRPC接口開發(fā),有高并發(fā)服務開發(fā)經驗(熟悉FastAPI/Flask/Django框架)
- 熟悉Kubernetes/Docker云原生架構,具備大規(guī)模分布式系統調優(yōu)經驗
- 了解大模型技術棧(如LangChain、vLLM、Triton Inference Server等框架)
- 具備模型服務化經驗者優(yōu)先(TensorFlow Serving/TorchServe/TRT-LLM等)
**加分項:**
- 有LLM API商業(yè)化落地經驗(如OpenAI API兼容開發(fā))
- 熟悉大模型推理優(yōu)化技術(動態(tài)批處理、持續(xù)批處理、PagedAttention等)
- 參與過開源AI項目貢獻或技術社區(qū)活躍者
---
### **我們提供**
?? **技術成長**:
- 零距離參與千億參數大模型工程化實踐
- 每年3次技術晉級通道,標配RTX 4090/A100開發(fā)機
- 定期硅谷技術連線交流
?? **極致福利**:
- 彈性工作制(核心工時11:00-16:00)
- 全額繳納六險一金 補充商業(yè)保險
- 年度健康體檢 心理健康服務
- 技術圖書自由采購預算
?? **未來權益**:
- 參與AI產品商業(yè)化收益分成
- 優(yōu)先獲得海外研發(fā)中心輪崗機會
- 年度帶薪參會預算(CVPR/NeurIPS等頂會)
---
工作地點
地址:北京朝陽區(qū)北京朝陽區(qū)遠洋光華國際1
??
點擊查看地圖
詳細位置,可以參考上方地址信息
求職提示:用人單位發(fā)布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業(yè)證等),均涉嫌違法,請求職者務必提高警惕。
職位發(fā)布者
葉女士HR
四川省瑞方人力資源管理有限公司
-
咨詢(財會·法律·人力資源)
-
100-199人
-
私營·民營企業(yè)
-
金馬鎮(zhèn)科源路456號

應屆畢業(yè)生
學歷不限
最近更新
2654人關注
注:聯系我時,請說是在河北人才網上看到的。
