🇬🇧 SearchUKJobs.co.uk

Britain's Premier Job Portal

← Back to Jobs

智能体-强化学习算法研究员-CodeBuddy/WorkBuddy

Tencent | Shenzhen, China | Posted June 09, 2026

Position Overview

智能体-强化学习算法研究员-CodeBuddy/WorkBuddy 深圳 分享

分享岗位

方式1:复制岗位链接

方式2:分享岗位海报

手机扫描二维码分享

收藏 CSIG 点击了解更多BG信息 技术 三年以上工作经验 更新于年06月18日 岗位职责
  • 1.作为研究者,探索有效的 Agentic Workflow 和 Agentic Memory 设计来解决代码领域的问题;
    2.主要关注比SFT泛化效果更好的强化学习;能结合实际用户需求、产生的用户数据、agent的实现细节,调整训练语料和训练目标;
    3.能和agent开发高效沟通,设计memory存取逻辑,并且通过模型训练让模型适配自己设计的agent;
    4.作为工程师,考虑到 LLM inference 对推理算力的高消耗,设计出合理的前后端交互,前端架构,后端架构,在有限的推理算力下,做出完整的 Agentic Workflow 解决方案。最好是探索一套通用可扩展的 Agentic Workflow 解决方案;
    5.备注:base地可选深圳/北京/上海。
  • 岗位要求
  • 1.自然语言处理/机器学习/模式识别/人工智能/计算机等相关专业硕士以上学历;
    2.有5年以上的工程编码经验,熟练掌握 Python,C/C++,Golang,Java,JavaScript,TypeScript 等至少一种语言;
    3.掌握深度学习基础知识,能根据具体问题做针对性优化,熟悉深度学习中不同任务及相应的主流模型和算法;
    4.对 Prompt Engineering、Agentic Workflow、GRPO等新的基于GPT结构的NLP强化学习方法 有实践经验;
    5.有高质量论文发表者优先(如ACL、EMNLP、NeurIPS、ICML、ICLR等)。
  • 加分项
  • 1.在同等条件下,通过腾讯云认证或取得同等资格认证的候选人,我们会优先考虑。
  • Ready to Apply?

    Apply for this Position