天工智能 | 2050研究院

RLHF 研究实习生

实习岗位

概述

2050研究院诚邀热情且具有前瞻性的小伙伴加入我们位于新加坡的天工2050研究实验室。作为研发团队的新成员，这是一个将理论付诸实践、同顶尖研究人员学习并为研发突破性技术的绝佳机会。

主要职责

在 RLHF（强化学习中的人类反馈）和基于 LLM（大语言模型）的代理相关主题进行前沿研究，确保研究成果发表在有影响力的会议和期刊上。
在专家导师的指导下，识别并解决提升 LLM 在数学推理、代码生成和内容创作能力方面的复杂问题。
开发算法、洞察或数据集，解决高级研究目标的关键方面。
利用并贡献于基于 LLM 的代理中的尖端工具和方法，并将这些进展应用于产品开发。

理想经验

优先考虑能够至少全职实习6个月的候选人。
正在攻读计算机科学或相关 STEM 学科的博士学位，专注于 LLM 应用，例如数学推理、代码生成、代理工具使用等。
在顶级会议或期刊（如 NeurIPS、ICLR、ICML、ACL、EMNLP 或同等）上有研究发表，表现出卓越的研究能力。
具有生成模型的扎实理解，具备 RLHF 专业知识者优先。
在深度学习框架（如 PyTorch 和 TensorFlow）中表现出熟练的编码技能。

申请方式

请将最新履历表和Cover Letter发送至 michelle@kunlun-inc.com。我们致力于促进多样性，欢迎所有背景的候选人申请。加入天工 2050 研究实验室，共同塑造 AGI 的未来。

其他岗位