上海人工智能实验室(上海AI实验室)面向全球招聘大模型人才。实验室现已推出书生大模型体系,涵盖书生·浦语、书生·万象通用基础模型及多个垂直领域专用模型。同时,实验室构建了大模型评测体系(司南OpenCompass),以纯粹技术及中立视角,为业界提供能力指标参考和优化方向指引。秉持以开源开放赋能创新的理念,实验室通过推进书生大模型及工具链开源,已助力诞生创新项目近千个,与各界共同促进了AI生态繁荣与产业发展。
现针对以下岗位开放招聘,欢迎投递简历。
大模型强化学习青年研究员/博士后
大模型算法青年研究员
语音和音乐生成青年研究员
语音识别和理解青年研究员
视频多模态大模型青年研究员/研究工程师
多模态大模型感知交互青年研究员/研究工程师
语言大模型训练优化算法工程师
大模型强化学习算法工程师
多模态大模型评测算法工程师
多模态大模型数据工程师
大模型评测工程师
大模型产品经理
大模型评测算法研究实习生
大模型评测算法工程实习生
语言大模型训练优化实习生
大模型强化学习算法实习生
大模型部署实习生
大模型量化实习生
大模型能力增强实习生
多模态大模型数据工程实习生
RLHF训练引擎实习生
(相关岗位具体内容可上下滑动查看)
投递方式
方式一:
发送简历同时至large-model-center@pjlab.org.cn;chuzhihui@pjlab.org.cn
邮件及简历命名格式:姓名 - 申请的岗位名称 -(全职/实习)
方式二:
登录上海人工智能实验室官方网站(www.shlab.org.cn)
点击导航栏“加入我们”,查看对应岗位并投递。(点击文末阅读原文直达)
全职岗位(面向社招、校招同步开放)
大模型强化学习青年研究员/博士后
岗位职责参与实验室书生大模型后训练阶段的强化学习及其规模化定律(Scaling Law)研究。工作内容包括:1、参与实验室书生大模型后训练阶段的强化学习算法研究,主要包括:基于AI和环境反馈的强化学习(RLXF)算法研究和以大模型为核心的多智能体强化学习算法研究,覆盖文本、图文多模态场景下指令遵循、复杂推理、代码、网页浏览等复杂任务;2、参与奖励和反思评价模型的相关研究,研究可泛化的细粒度过程监督和奖励建模,并探索基于细粒度反馈的强化学习算法,覆盖文本、图文多模态场景下指令遵循、复杂推理、代码、网页浏览等复杂任务;3、参与后训练和推理阶段的规模化定律研究,包括:奖励和反思评价模型训练、强化学习阶段、推理阶段的规模化定律研究;4、参与世界模型相关研究,面向文本、图文多模态场景下的复杂推理与规划场景,研究基于世界模型的推理规划和强化学习训练算法;5、参与推动最新的强化学习后训练方案的规模化工程实践与落地应用。
岗位要求1、博士学位,人工智能等相关专业优先(如计算机科学、数学、统计、电子工程等),有强化学习研究经验优先;2、熟悉大模型领域尤其是强化学习相关研究工作和算法,有大模型强化学习的研发基础,拥有高影响力顶会论文、知名竞赛获奖、顶级研究机构工作经验者优先;3、熟练使用 Python、PyTorch、Ray 等语言和代码库,能够研判领域内最新的研究趋势,能够系统性对比研究领域相关成果并制定探索计划,有强化学习训练系统、大模型训练系统及相关底层代码库的工程开发优化经验者优先;4、目标导向,有优秀的学术视野和判断力,具备优秀的问题提出、分析和解决能力,良好的团队协作精神和沟通意识。
大模型算法青年研究员(数学推理)
岗位职责1、参与实验室书生大模型后训练阶段数理、代码等复杂推理能力提升及其规模化定律(Scaling Law)研究。工作内容包括:2、参与实验室书生大模型后训练阶段的复杂推理能力提升的算法研究,探索高质量数据合成、强化学习等技术路线以提升大模型的复杂推理能力,覆盖文本、图文多模态场景下的数理和代码等复杂推理任务;3、参与后训练和推理阶段(Inference Time)的复杂推理能力的规模化定律研究,包括:奖励和反思评价模型训练、强化学习阶段、推理阶段的规模化定律研究;4、参与推动最新的复杂推理能力提升的后训练方案的规模化工程实践与落地应用。
岗位要求1、博士学位,人工智能等相关专业(如:计算机科学、数学、认知科学等)优先;2、熟悉大模型领域相关研究工作和算法,有大模型推理能力提升的研发基础,拥有高影响力顶会论文、知名竞赛获奖、顶级研究机构工作经验者优先;3、熟练使用 Python、PyTorch等语言和大模型训练/微调相关代码库,能够研判领域内最新的研究趋势,能够系统性对比研究领域相关成果并制定探索计划,有强化学习训练系统、大模型训练系统及相关底层代码库的工程开发优化经验者优先;4、目标导向,有优秀的学术视野和判断力,具备优秀的问题提出、分析和解决能力,良好的团队协作精神和沟通意识。
语音和音乐生成青年研究员
岗位职责1、推进语音和音乐生成技术的研发,研究内容包括但不限于:语音生成、音乐生成、音频事件、多模态生成(如音频驱动的说话人生成、视频配音等)、生成式模型在音频生成等任务中的应用、音乐风格迁移等;2、探索语音和音乐生成在多模态大模型中的应用,如研究如何将语音合成模型融入多模态大模型中;3、在顶级学术会议和期刊上发表研究成果,申请专利并转化成果;4、参与实验室开源社区的建设,参与团队研究平台研发。
岗位要求1、博士学位,计算机等相关专业优先,具备语音生成、音乐生成或相关领域的深厚研究背景者优先;2、熟悉常见生成式模型,在语音领域顶级会议(如ICASSP、INTERSPEECH、ASRU/SLT等)或期刊(如IEEE/ACM TASLP、JASA等),或机器学习领域顶级会议(如NeurIPS、ICLR、ICML)发表过论文者优先;3、熟练掌握深度学习框架,具备优秀的算法实现和代码优化能力;4、富有创新精神,能够独立完成科研任务,具备指导博士生和实习生的能力;5、拥有强烈的进取心和良好的团队沟通协作能力。
语音识别和理解青年研究员
岗位职责1、推进语音识别和理解相关技术的前沿研究,内容包括但不限于:语音识别、语音合成、多语言识别与理解、语音翻译等;2、推动多模态大模型中语音识别与理解能力的提升,探索如何将语音信号与其他模态(如图像、文本、视频)进行深度融合;3、在国际顶级会议和期刊上发表高水平学术论文,申请专利并转化成果;4、参与实验室开源社区的建设,参与团队研究平台研发。
岗位要求1、博士学位,计算机等相关专业优先,在语音领域顶级会议(如ICASSP、INTERSPEECH、ASRU/SLT等)或期刊(如IEEE/ACM TASLP、JASA等)发表过论文者优先;2、具备语音识别、自然语言处理、基础模型等相关领域的研究或工作经验,熟悉深度学习模型如Transformer、RNN等在语音任务中的应用;3、熟练掌握深度学习框架,具备优秀的算法实现和代码优化能力;4、富有创新精神,能够独立完成科研任务,具备指导博士生和实习生的能力;5、拥有强烈的进取心和良好的团队沟通协作能力。
视频多模态大模型青年研究员/研究工程师
岗位职责1、负责大模型长时视频理解相关算法研究和研发工作,提升多模态大模型相关能力,领域包括但不限于:视频理解、多模态学习和对话系统、结构设计、数据集构建等;2、提出和实现最前沿的算法,保持算法在学术界和工业界的领先,推动各类算法在众多实际应用领域的性能优化和落地。
岗位要求1、硕士及以上学位,计算机科学与技术、人工智能等相关专业优先,有相关工作经验者优先;2、熟练掌握机器学习(深度学习)的基本方法,熟悉计算机视觉中的常见问题和算法,熟悉PyTorch/ TensorFlow等任一深度学习框架;3、掌握岗位职责中提及的某一领域或多个领域的技术算法,有相关的研究经验和产出;4、具有卓越的分析和解决问题能力,对解决具有挑战性的问题充满激情,拥有较强的自我驱动力;5、较强的算法实现能力,熟练掌握Python、C/C++等;6、拥有以下任意一项学术成果者优先:‐有发表学术论文、特别是顶级会议或期刊的学术论文经历,如CVPR/ICCV/ECCV/NeurIPS/ICML/ICLR/AAAI/SIGGRAPH等(排名不分先后);‐拥有长时视频理解相关经验,擅长相关结构设计、优化、验证等;‐有较强的编程能力,ACM-ICPC/CCPC区域赛金牌及以上、EC Final银牌及以上、World Final Honorable Mention及以上成绩,或在Google Code Jam/KickStart、Facebook Hackathon取得前5%的排名或满分;‐参加过领域或行业内较有影响力的比赛,如Kaggle/Codalab/KDD Cup/DrivenData/阿里天池等,并取得前5%的排名。
多模态大模型感知交互青年研究员/研究工程师
岗位职责1、推进多模态大模型感知交互技术的研究,包括多模态对齐、多模态视频语音交互、多模态长期记忆、多模态强化学习等方向;2、参与实验室多模态大模型项目的研发和交付,参与开源项目维护。
岗位要求1、硕士及以上学位,计算机等相关专业优先,具备深度学习(计算机视觉、自然语言处理等)相关领域背景,有大模型训练部署基础者优先;2、用有顶会、顶刊论文发表经验者优先(如:CVPR、ICCV、ECCV、NeurIPS、ICLR、ICML、ICASSP、INTERSPEECH等);3、熟练掌握深度学习框架,具备优秀的算法实现和代码优化能力;4、拥有创新精神,能够独立完成科研任务,具备指导实习生的能力;5、拥有强烈的进取心和良好的团队沟通协作能力。
语言大模型训练优化算法工程师
岗位职责1、参与语言大模型的训练与调优,稳定大模型训练、提高训练效率等;2、优化从数据生产、数据配比到大模型训练的全流程;3、负责语言大模型算法库的相关工作,实现并维护算法库。
岗位要求1、硕士及以上学位,计算机或人工智能相关专业优先;2、熟悉自然处理处理常见模型,有过相关大模型训练语调优经验者优先;3、熟练掌握Python和PyTorch,有较强的工程能力,熟悉CUDA开发和性能调优者优先;4、熟悉Deepspeed、Colossalai或Megatron等大模型训练框架优先;5、有顶会论文、知名学术工作、开源项目经验、国际竞赛成果者优先。
大模型强化学习算法工程师(多目标强化学习)
岗位职责参与实验室书生大模型后训练阶段的强化学习技术研发迭代与工程规模化。具体工作内容包括:1、参与书生大模型后训练阶段的强化学习算法研发迭代,包括:基于人类、AI、环境反馈的强化学习(RLXF)算法的优化升级,覆盖指令遵循、复杂推理、代码、幻觉抑制等多个任务的通用多目标强化学习训练算法研发和调优;2、负责构建高质量大规模的强化学习偏好与反馈和强化学习训练数据集,研发迭代可泛化的奖励模型,目标任务包括但不限于:文本、图片、视频等数据,覆盖主观对话、指令遵循、复杂推理、代码、幻觉抑制等任务;3、负责大模型强化学习训练框架的工程开发优化,参与大模型强化学习训练框架的日常维护、研发迭代、大规模训练效率提升。
岗位要求1、本科及以上学历,人工智能等相关专业优先(如计算机科学、数学、统计、电子工程等),有强化学习研究经验优先,博士学位优先;2、熟悉强化学习领域的相关研究工作和算法,熟悉大模型领域相关研究工作,有强化学习方向相关工作经验者优先;3、熟练使用Python、PyTorch、Ray等语言和代码库,具备快速阅读和复现论文的能力,能够系统性对比研究领域相关成果并制定改进计划,有强化学习训练系统、大模型训练系统及相关底层代码库的工程开发优化经验者优先;4、目标导向,具备优秀的问题提出、分析和解决能力,良好的团队协作精神和沟通意识;拥有发表顶会论文、知名竞赛获奖、顶级研究机构工作经验者优先。
多模态大模型评测算法工程师
岗位职责1、参与多模态大模型评测体系建设;2、负责多模态大模型评测框架的开发与维护;3、负责多模态大模型榜单交付,及评测体系影响力建设;4、参与推进特定多模态任务或能力构建相应评测基准;5、分析整理实验结果,清晰有效地报告和展示研究成果。
岗位要求1、硕士及以上学位,人工智能、计算机、自动化等相关专业优先,有1年及以上工作经验者优先;2、具备扎实的机器学习基础,能快速掌握领域最新研究动态,在计算机视觉/机器学习/自然语言处理等顶级会议期刊上发表过论文者优先;3、具备优秀的代码能力,熟悉 Python,掌握PyTorch等机器学习框架使用,有过较大规模项目开发及维护的经历;4、具备良好的沟通协作能力,能在团队中一起探索突破领域难题;出色的问题分析和解决能力,积极主动的学习意愿。
多模态大模型数据工程师
岗位职责1、专注于多模态大模型数据的清洗、过滤和整理,与模型训练团队密切合作,确保高质量的数据支持机器学习项目。2、数据清洗与整理:负责收集和处理原始数据,识别和修正数据中的错误与异常,以确保数据的准确性和一致性;3、协作构建训练数据集,与模型训练侧紧密合作,理解项目需求,构造和准备符合要求的高质量训练数据集,提升模型性能;4、开发数据处理管道:设计和维护自动化的数据处理管道,以提高数据清洗和整理的效率,减少人工干预;5、监控与维护数据管道:实时监控数据管道的运行状态,及时识别并解决潜在问题,确保数据流的连续性和稳定性;6、文档与最佳实践分享:撰写清晰的文档,记录数据处理流程和方法,并与团队分享数据处理的最佳实践,以促进知识传递。
岗位要求1、本科及以上学历,计算机、软件工程、电子信息等相关专业优先,具备1年以上数据清洗工作经验;2、精通Python编程语言,能够使用相关库(如Pandas、NumPy)进行数据处理,同时具备Spark使用经验者优先;3、了解大模型相关基础知识,具备大模型相关经验者优先,能够应用于数据处理和分析中;具备良好的沟通能力,能够与不同团队成员有效协作,推动项目进展。
大模型评测工程师
岗位职责1、负责大模型评测技术体系(OpenCompass司南)建设,包括但不限于:评测系统搭、评测方案与评测集的迭代、评测执行与分析、评测榜单发布等;2、开展评测相关技术研究,如:大模型复杂推理能力、主观对话体验、长文本理解与生成等专项能力、探索动态评测技术路线等;3、负责对内外部大模型能力分析,输出相关行业分析报告和技术白皮书等;4、支持大模型评测的生态合作,持续提升司南的影响力。
岗位要求1、本科及以上学历,计算机科学与技术、人工智能等相关专业优先,三年及以上工作经验者优先;2、具有一定自然语言处理或大模型相关算法经验;3、具有质量测试交付、测试工程开发相关经验者优先;4、熟悉前后端、数据库相关知识和工具者优先;5、工作认真严谨,具有良好的沟通能力、团队合作以及独立解决问题的能力。
大模型产品经理
岗位职责1、负责大模型相关的产品工作,包括:对话流程设计,对话内容生成,对话交互逻辑设计,以及模型部署和评估等;2、负责研究和设计自然语言处理、机器学习等相关技术不断提升对话系统的性能和用户体验;3、参与前沿大模型算法应用的产品功能评估、设计、优化等工作。
岗位要求1、本科及以上学历,计算机、人工智能、心理学等相关专业优先,1年及以上工作经验优先;2、了解大语言模型的技术原理和潜力,熟悉自然语言处理、机器学习等相关技术,有相关项目经验者优先;3、熟悉聊天工具、即时通信软件、社交软件的产品功能和逻辑;4、有较强的学习能力和团队协作能力。
实习岗位
大模型评测算法研究实习生
岗位职责1、参与大语言模型的研发迭代,深入调研和关注LLM等方向的前沿技术,重点关注大语言模型的评测和对齐等相关方向;2、参与知名开源项目建设,参与研发前沿大语言模型相关前沿算法,发表国际顶级论文、申请专利等;3、参与大模型评测工具软件和工具平台的的研发,参与知名开源项目建设。
岗位要求1、博士研究生在读,人工智能、计算机、自动化、数学相关专业优先;2、具备扎实的数据结构和算法设计基础,熟练掌握Python或C++中的一种或多种编程语言,熟练掌握PyTorch、Tensorflow 等深度学习框架,拥有大型开源项目经验者优先考虑;3、熟悉大模型基础架构,算法基础扎实,了解LLM和VLM前沿进展、微调训练、性能评估及其下游应用优先;4、以第一作者身份在国际顶级学术会议投递或发表至少一篇学术论文,在自然语言处理、多模态、计算机视觉或机器学习领域的比赛中获得过优异成绩者优先;5、每周到岗4-5天,可连续实习3个月以上,拥有良好的英文读写能力和数学基础;责任心强,积极主动,善于沟通及团队合作。
大模型评测算法工程实习生
岗位职责1、参与大模型评测工具软件和工具平台研发,参与知名开源项目建设;2、参与大语言模型的研发迭代,深入调研和关注LLM等方向的前沿技术,重点关注大语言模型的评测和对齐等相关方向。
岗位要求1、本科在读及以上学历,人工智能、计算机、自动化、数学相关专业优先;2、拥有扎实的数据结构和算法设计基础,熟练掌握Python/C++中的一种或多种,熟练掌握Pytorch、Tensorflow等深度学习框架,有大型开源项目经验优先;3、熟悉大模型基础架构,算法基础扎实,了解LLM前沿进展、性能评估及其下游应用优先;在自然语言处理、多模态、计算机视觉或机器学习领域的比赛中获得过优异成绩者或发表过学术论文优先;4、每周到岗4-5天,可连续实习3个月以上,有良好的英文读写能力和扎实的数学基础;责任心强,积极主动,有良好的沟通能力和团队合作能力。
语言大模型训练优化实习生
岗位职责1、参与语言大模型的训练与调优,稳定大模型训练、提高训练效率等;2、参与优化从数据生产、数据配比到大模型训练的全流程;3、参与语言大模型算法库相关工作。
岗位要求1、本科在读及以上学历,计算机或人工智能相关专业优先,发表过顶会论文者优先;2、熟悉自然处理处理常见模型,有过相关大模型训练语调优经验者优先;3、熟练掌握Python和PyTorch,有较强的工程能力;熟悉CUDA开发和性能调优者优先;4、熟悉Deepspeed、Colossalai或Megatron等大模型训练框架者优先;有知名学术工作、开源项目、国际竞赛成果者优先。
大模型强化学习算法实习生(多智能体自主演进)
岗位职责参与实验室书生大模型多智能体自主演进相关研究。工作内容包括:1、参与实验室书生大模型的多智能体协作系统的相关研究探索,研究如何拓宽系统的能力边界与并提升系统的能力上限;2、参与探索多智能体系统的自主演技方法,探索强化学习等手段提升多智能体协作系统的可用性、可靠性和泛化性;3、参与研究多智能体系统的细粒度评价方式,包括:设计可靠、细粒度的评价方法来评估多智能体系统的能力边界与可靠性。
岗位要求1、在读博士研究生,人工智能等相关专业(如:计算机科学、数学、认知科学等)优先;2、熟悉大模型领域尤其是(多智能体)强化学习相关研究工作和算法,有大模型智能体和强化学习相关的研究基础,拥有高影响力顶会论文、知名竞赛获奖、顶级研究机构实习经验者优先;3、熟练使用Python、PyTorch、Ray等语言和代码库,能够研判领域内最新的研究趋势并制定研究计划和实验方案,有多智能体系统、强化学习训练、大模型训练的开发和实验经验者优先;4、目标导向,有优秀的学术视野和判断力,具备优秀的问题提出、分析和解决能力,良好的团队协作精神和沟通意识。
大模型部署实习生
岗位职责1、参与LMDeploy项目研发,支持多模态模型的推理和优化;2、参与InternLM、 InternVL系列模型在下游部署生态项目上的支持、建设和拓展。
岗位要求1、本科在读及以上学历,计算机科学、人工智能、数学等相关专业优先;2、熟练使用Python或者C++、PyTorch,工程能力扎实;3、熟悉主流的LLM、VLM模型结构,从事过模型推理优化相关的项目;4、为Llama.cpp、VLLM、LMDeploy等开源 LLM 推理框架添加过模型支持者优先;5、能够使用OpenAI Triton或CUDA进行算子开发者优先。
大模型量化实习生
岗位职责参与持续优化大模型量化后的推理性能,探索更低成本的量化算法。
岗位要求1、本科在读及以上学历,计算机科学、人工智能、数学等相关专业优先;2、熟悉LLM量化的前沿算法,如AWQ、GPTQ,了解CUDA的基本原理;3、能够使用OpenAI Triton或CUDA进行算子开发。
大模型能力增强实习生
岗位职责1、参与大模型数据构造、训练算法等方面的研发;2、分析大模型训练过程的行为变化、数据因素等;3、参与大模型训练,实现定向能力增强。
岗位要求1、本科在读及以上学历,计算机、数学、统计学以及相关专业优先;2、拥有熟练的编程能力,对算法、机器学习有深入了解,掌握Python,Pytorch等主流开发工具;3、有深度学习、自然语言方面、计算机视觉的知识储备,熟悉大模型相关技术;4、在ACL、CVPR、ICCV、NAACL、EMNLP、COLING、NIPS、ICML、AAAI等相关会议发表论文者优先。5、有数据处理、合成、CoT增强、RL,MCTS等经验或相关知识者优先。6、每周到岗4-5天,可连续实习4个月以上。
多模态大模型数据工程实习生
岗位职责1、与模型训练团队密切合作,学习如何准备和处理高质量的数据,以支持机器学习项目;2、协助数据清洗与整理:在指导下收集和处理原始数据,学习识别和修正数据中的错误与异常,以确保数据的准确性;3、支持构建训练数据集:与模型训练团队合作,理解项目需求,协助构造和准备符合要求的训练数据集,为模型训练提供支持;4、参与数据处理管道的开发:学习如何设计和维护数据处理管道,逐步提高数据清洗和整理的效率,减少手动操作;5、监控数据管道的运行:协助实时监控数据管道的状态,学习如何识别并报告潜在问题,确保数据流的稳定性;6、记录与分享学习过程:撰写实习期间的学习文档,记录数据处理流程和方法,分享学习经验,促进团队知识传递。
岗位要求1、本科在读及以上学历,计算机、软件工程、电子信息等相关专业优先;2、熟悉Python编程语言,了解数据处理相关库(如Pandas、NumPy),有Spark使用经验者优先;3、具备良好的沟通能力,能够与不同团队成员有效协作,推动项目进展。
RLHF训练引擎实习生
岗位职责1、参与开发支持大规模训练的多种模态RLHF训练引擎;2、参与持续优化RLHF训练效率(生成效率、并行效率),产出有影响力的论文或技术报告。
岗位要求1、研究生在读及以上学历,计算机、人工智能等相关专业优先,有相关经验者优先;2、熟悉Megatron、DeepSpeed、Colossal AI或PyTorch FSDP中任意一个并行训练框架;3、了解VLLM、Sglang 或LMDeploy 任意一个推理引擎;4、了解RLHF算法基本原理与流程;5、具备使用OpenAI Triton或CUDA开发算子能力优先。