将以线下与线上结合的形式召开,线下会场设在中关村国家自主创新示范区会议中心。2024智源大会再次以全球视野,汇聚年度杰出工作研究者,交流新Kaiyun官方中国思想,探讨新思路,引领新前沿。目前已正式开放报名渠道。
中国电信人工智能研究院 AI研发中心副总经理,作为核心成员参与从0-1组建中国电信人工智能研发队伍,打造完整的图像、语音、语义和多模态核心算法能力,支撑中国电信全网人工智能业务发展;建立基础大模型全栈自研能力,相继开源7B/12B/52B等多个版本语义大模型,发布国内首个支持30种方言自由混说的语音大模型,通过国家网信办算法和产品双备案;带领团队获得18项国际AI顶会竞赛冠亚军,发表高水平论文十余篇,作为技术负责人牵头多项部级重大科技攻关课题。
王业全,智源研究院研究员,国家“新一代人工智能国家科技重大专项”负责人,FLM团队负责人,清华大学博士,中国人工智能学会具身智能专委会委员,2022年被评为AI 2000全球最具影响力人工智能学者(自然语言处理领域)。近年来,主要从事大模型方面的研究工作,代表成果有 FLM系列模型(Tele-FLM、FLM-101B)、Mu-Scaling、MSG和ATAE-LSTM等。在国际顶级会议发表多项研究成果,谷歌学术引用超3,000次。ATAE-LSTM和RNN-Capsule被PAPER DIGEST评为最具影响力论文,同时多次入选谷歌学术刊物指标榜单。
中国电信人工智能研究院语义大模型团队负责人,高级算法总监、集团高级专家,博士毕业于中国科学院自动化研究所,读博期间以及毕业后一直从事自然语言处理算法研发工作,目前负责星辰语义大模型和智能对话等算法研发。曾就职于阿里达摩院、京东科技任算法负责人,主导包括京东言犀智能客服系统、阿里店小蜜商家客服平台和阿里小蜜智能情绪分析平台等研发工作。已授权开云网站专利4项,已发表SIGIR、在内的各类高水平国内外会议期刊发表文章70余篇,曾分别任中国自动化学会委员、国际顶刊Decision Support Systems副主编、以及20多个顶会顶刊的PC member、Session Chair及审稿人,获得APWeb 2022的Outstanding Paper、第四届大数据体系高峰论坛优秀论文一等奖,PAKDD国际评测第一名,CCF和CCL举办的多个评测的一、二等奖等各类奖项。
报告简介:以GPT为代表的大模型涌现的机器智能为大小模型协同学习提供了契机。大模型的巨量参数存储了从海量数据中学习到的知识,同时其惊人的意图理解能力和分析推理能力为指导小模型性能提升提供了可能性。本报告将从知识蒸馏和意见咨询两个角度介绍大模型指导小模型算法优化上的研究Kaiyun官方中国进展。其中,知识蒸馏方面的进展以大模型回答与解释之间的一致性为指导,优化小模型在NLP相关任务上的表现。意见咨询方面的进展则是指在小模型训练过程中,用预测不确定性挑选难样本向大模型发起咨询,利用大模型的反馈意见增强小模型在图机器学习任务上的表现。
Copyright © 2024 开云沙盘有限公司 版权所有 备案号:蜀ICP备19012180号 网站地图