【岗位职责】
作为大语言模型算法研究员,参与“商量SenseChat”基座模型的关键技术研发,提升模型通用人工智能能力,支持重点行业客户的大模型业务落地。与顶尖专家合作,挑战人工智能技术边界。与数据团队合作,筛选、清理和标注训练数据集。通过预训练、SFT、RLHF等流程不断提升模型性能和安全性。跟踪最新的LLM等大型模型研究,改进和创新模型架构和应用场景。与产品团队合作,将训练好的模型集成到公司产品中。编写技术文档,记录模型架构、训练过程和性能评估。
【岗位要求】
计算机科学、数学、统计学或相关领域硕士学位。至少3年生产环境训练深度学习模型经验。熟悉Python编程语言和深度学习框架,如TensorFlow或PyTorch。深入理解NLP和机器学习算法,如BERT、GPT、Transformer等。有使用大规模数据集进行分布式训练经验。良好的数据分析和问题解决能力。优秀的沟通技巧和团队合作精神。
【优先条件】
博士学位或相关领域研究背景。有超大规模机器学习任务经验。了解生产级系统设计和架构。发表过相关领域研究论文或参与开源项目。
报名邮箱:zhangjunyu@sensetime.com
工作地点:深圳、香港、北京、上海
温馨提示:微信搜索公众号【深圳之窗】,关注后在对话框内回复【上市公司】可获取深圳上市公司最新招聘信息、报名+附件下载入口、岗位表等。
手机访问 深圳之窗首页
深圳之窗 微信公众号一大波便民功能上线啦!扫面下方二维码,关注后在微信对话框中回复“ 摇号 ” 即可实时获取申请最新结果;回复“ 电费 ” 即可在线查询用电信息以及缴费!
分享到
