<返回

RLHF 研究实习生

实习岗位

概述

2050研究院诚邀热情且具有前瞻性的小伙伴加入我们位于新加坡的天工2050研究实验室。作为研发团队的新成员,这是一个将理论付诸实践、同顶尖研究人员学习并为研发突破性技术的绝佳机会。

主要职责

  • 在 RLHF(强化学习中的人类反馈)和基于 LLM(大语言模型)的代理相关主题进行前沿研究,确保研究成果发表在有影响力的会议和期刊上。

  • 在专家导师的指导下,识别并解决提升 LLM 在数学推理、代码生成和内容创作能力方面的复杂问题。

  • 开发算法、洞察或数据集,解决高级研究目标的关键方面。

  • 利用并贡献于基于 LLM 的代理中的尖端工具和方法,并将这些进展应用于产品开发。

理想经验

  • 优先考虑能够至少全职实习6个月的候选人。

  • 正在攻读计算机科学或相关 STEM 学科的博士学位,专注于 LLM 应用,例如数学推理、代码生成、代理工具使用等。

  • 在顶级会议或期刊(如 NeurIPS、ICLR、ICML、ACL、EMNLP 或同等)上有研究发表,表现出卓越的研究能力。

  • 具有生成模型的扎实理解,具备 RLHF 专业知识者优先。

  • 在深度学习框架(如 PyTorch 和 TensorFlow)中表现出熟练的编码技能。

申请方式

请将最新履历表和Cover Letter发送至 michelle@kunlun-inc.com。我们致力于促进多样性,欢迎所有背景的候选人申请。加入天工 2050 研究实验室,共同塑造 AGI 的未来。