阿里巴巴-达摩院视觉大模型团队-研究型实习生
【岗位方向】
1、负责视觉生成算法的研发,包括但不限于文生图、文生视频、基于生成模型的高效调优方法(如LoRA)。在Senior Researcher的指导下进行方法创新并投递顶会论文。
2、负责视觉大模型的设计、训练与调优,完成以下可能题目之一:Generate Anything / Understanding / Segment / Represent / Detection。并将研究成果应用于创新产品或以论文形式投递顶会。
【岗位要求】
1、对多模态内容的各类算法及下游任务有一定的理解,并在如下一个或多个相关方向有深入研究:图像 / 视频生成;图像 / 视频表征、检测、分割等。
2、具备扎实的编程功底,熟悉Pytorch等主流深度学习框架,熟练使用Python / C++等至少一种编程语言,熟悉Linux开发环境。
3、对学术前沿有浓厚兴趣,能够跟进技术前沿,有良好的沟通表达能力以及英文写作能力。
4、有视觉顶会(包括但不限于:NIPS、CVPR、ICLR、ICML等)中稿或投递经验者优先;有相关岗位实习经历者优先;实习6个月以上者优先。
5、Base北京或杭州均可,硕士、博士或高年级本科生均可。
【岗位福利】
1、丰厚的实习津贴、良好的工作环境;丰富的计算资源;丰富经验的研究员细心指导与合作。
2、表现优异者有机会在秋招中优先录取。

感兴趣的同学可以将个人简历发送至dave.ma@alibaba-inc.com