大模型研究实习生
工作地点:北京
岗位职责

  1. 基于GPT-3.5, GPT-4, DALLE-2等基础模型开展研究和应用;
  2. 研究方向:Large Language Model Reinforcement Learning, Multimodal Undestanding and Generation;
  3. 针对NLP与多模态研究领域进行探索,提出问题并设计开展相关实验,推动算法开源与产生影响力;
  4. 将研究成果投稿至国际权威期刊或顶级会议。
    岗位要求
  5. 计算机,数学,统计等相关专业硕士及以上学历;
  6. 对LLM, AIGC等方向的基础知识与前沿算法有良好的理解与掌握;
  7. 在ACL/EMNLP/NAACL/NeurIPS/ICLR/ICML/CVPR/ICCV/ECCV等会议有发表记录;
  8. 优秀的编程能力,有多机多卡分布式训练经验,熟练使用DeepSpeed, Megatron, Fairscale等工具中的一种或多种;
  9. 条件优异者可以远程实习。
  10. 投递邮件:puzhao@microsoft.com
    邮件主题:姓名-学校-NLP实习生申请