专访复旦大学MOSS系统负责人邱锡鹏:ChatGPT的革命性体现在大模型的“涌现能力”
ChatGPT展现出来的令人惊艳的对话理解与表达能力,让越来越多人意识到,人工智能已经迎来了全新的里程碑。并且有望作为一个至关重要的基座系统,以前所未有的速度渗透进各行各业,持续引爆未来世界的数字经济体系。
(相关资料图)
近日,复旦大学计算机科学技术学院教授、MOSS系统负责人邱锡鹏在接受21世纪经济报道记者专访时表示,ChatGPT的革命性体现在大模型的“涌现能力”上。在大模型训练过程中,出现了一些意外的、超乎预期的能力表现。据悉,在训练计算量大概在10的22次方之后,模型能力会完成从量变到质变的飞跃,呈现出惊人的爆发式增长。
“比如说你读两本书可能就背下来,但是当你读1万本的时候,你可能就理解了一些道理,当你读1亿本的时候,很可能融会贯通,从中掌握世界的规律。”邱锡鹏表示。但大模型具体是怎样在突破某个值后突然变得智能,仍然是个未解之谜。
不过,“涌现”的出现似乎也证明了一条路是正确的,即扩大模型规模,即可使其具有“智能”。在AI围棋打败人类棋手之时,Google Bert的参数规模为3亿;2020年后GPT-3横空出世,参数量级已经跨越到了1750亿。
涌现能力的背后,则进一步隐含着三个非常重要的技术:情景学习、思维链和指令学习,这也是ChatGPT得以在人工智能领域叱咤风云的关键原因。
情景学习深刻改变了传统机器学习的范式,只需要通过一系列精心设计的提示语句(Prompt),对任务进行详细描述,然后再辅以一些情景例子,就能够让模型参考着既定例子完成特定任务。
思维链则使得模型具有了推理的能力,让本来模型不会解的一个个复杂问题,分解成很多简单问题,然后通过逐一解决简单问题,最终使得复杂问题同样迎刃而解。
指令学习则使模型能够理解并执行各种自然语言指令,将任务指令化以便机器理解。人类只需要在少量的任务上进行指令化,在经历大概40多个任务指令化之后,对模型进行适度微调,就很容易泛化到上百、上千种任务,即使它从来没有见过。
在模型优化过程中,人的参与意义非常重要,使得机器在迭代中始终保持和人类的价值观、思维方式对齐,也避免了机器自己迭代起来有可能会离人类的偏好和初衷越来越远。
放眼国内,大模型的竞争也愈发激烈。2月20日,复旦大学自然语言处理实验室发布了国内首个类chatgpt模型MOSS,3月16日,百度发布“文心一言”,打响大厂入局的第一枪,此后,阿里云、商汤科技均公布了自家的大模型产品,国内大模型的百团大战一触即发。
但这些产品较ChatGPT来说,还存在一定差距,邱锡鹏也承认,目前MOSS的任务完成度却并不高,主要原因在于MOSS在部署和训练上投入的资本还非常有限,相较于千亿级的ChatGPT,大概只是其规模的十分之一。“我们现在仍旧在加紧迭代MOSS,预计将于4月中旬开源。”
邱锡鹏表示,尽管目前的通用人工智能技术尚且存在很多不足,包括随机性、不可控、容易“一本正经地胡说八道”等等,但随着时间的推移,这些问题都将在未来通过各种方式逐步改进。
正如图灵奖得主、著名人工智能专家杨立昆(Yann LeCun)所言:下一代模型应该更加具有事实性、无害性、即时性,并且能够灵活使用计算器、数据库、搜索引擎、模拟器等各种辅助工具,而这也是人们亟需重点解决的时代课题。
《21世纪》:我们如何复现ChatGPT这一大型语言模型?面临哪些挑战?
邱锡鹏:第一步需要先实现语言模型基座,第二步是指令微调,第三步是能力不断强化迭代。虽然这些关键步骤以及大概方法已经十分明朗,但每一步的细节都需要我们自己去一一摸索,还是充满着各种未知的挑战性。
第一步主要是Transformer架构上进行模块优化。首先,对于ChatGPT来说,它并没有特别关注中文,很多时候只是直接把中文按照英文的方式进行编码,我们作为中国人自然是希望对中文进行优化,就需要重新实现更好的中文编码,并想办法把中文和英文打通;此外,将来如果接入多模态的话,编码问题同样会带来架构设计以及训练稳定性等诸多问题与麻烦。
第二步是指令微调,个人认为指令微调的难度甚至比预训练更高。在预训练阶段,大家可以利用一些大公司成熟的预训练模型,在短时间内取得不错的训练效果;但是指令微调则非常难以立马做到,这一点上和OpenAI之间存在着非常明显的差距。
在与人类对齐方面,想要让模型的回答尽可能符合我们人类的思维习惯,也很难做到。而且考虑到OpenAI暂不开源,我们只能够一步步慢慢向前探索。如果我们要想超过ChatGPT,肯定就得去找到一条比它更好的实现路径,而这个过程无疑充满艰险。
《21世纪》:如何看待国内AI生态?
邱锡鹏:我们的生态还没有建好。OpenAI做ChatGPT的时候,它不需要分心做其他东西,只是把模型做好。微软帮它做算力,还有其它公司帮它做部署,数据也有专门的公司来进行数据清洗。它是在整个生态中去做的,这样的多方协作生态促使它的发展非常快。
而我们国内每家公司都要做,这就会产生一个问题,每家都做自己的,但每家数据、算力也有限,也没有多少钱可以支持研发,并且又在做一些很基础的、重复性的事情。而我们希望能促进大模型的协作生态,在MOSS开源之后,底层的重复性的工作就不要做了,把整个生态建起来。
如果我们有一个统一的大模型平台和基座,下面对接一下国产的算力,做好一份接口,大家都可以来用,能够去促进一个生态链的建设,使得整个中国的AI能够往前进一步发展。我们现在仍旧在加紧迭代MOSS,预计将于4月中旬开源。
《21世纪》:3月22日,美国的生命未来研究所向全社会发了一封公开信,呼吁所有的人工智能实验室暂停研制比GPT-4更强大的AI系统的训练,暂停的时间是6个月,如何看待这件事?
邱锡鹏:机器的迭代速度会快于人,在某一天总会超过人的,停止这六个月或者半年没有意义。并且很多时候也很难停下来,从很多公司的商业利益出发肯定会迭代的。我们目前为止的AI还是可控的,它目前的形式还是在语言层面的,没有接入到社会的方方面面。有一天当它接管了很多东西,成为了我们的某种基础设施之后,这就非常关键了,你要控制它各种能力,这时避免危害不光要靠技术,还要靠一些法律法规。
《21世纪》:类ChatGPT的AI将如何对未来社会形成颠覆性影响?
邱锡鹏:考虑到ChatGPT已拥有通用语言理解的能力,并可以进一步增加对外接口,成为通用人工智能的技术基座。这也就意味着通用人工智能的加速实现对于现阶段的人类来说已经不是梦想。甚至乐观一点说,像科幻片里面的人工智能形象可能很快就会在我们的生活中出现。
以ChatGPT为代表的通用人工智能技术,可以引爆数字经济,充分发挥数据和算力效能,并催生出海量的新商业模式;可以赋能产业数字化,并通过人机协同的方式解决行业专家资源不足的问题;可以以数字人、个人助理、搜索引擎等形式对数字经济新业态、新模式提供发展动能;更将深刻改变教育、社会治理、司法等领域的生态,大幅提升行业水平。
当然,我们也必须正视,目前的通用人工智能技术尚且存在很多不足,包括随机性、不可控、容易“一本正经地胡说八道”等等,不过,相信这些问题随着时间的推移,都将在未来通过各种方式逐步得到改进。
对于下一阶段的大型语言模型来讲,我们目前重点需要去做的事情就是让模型和现实世界以及人类的价值观进行“对齐”,成为一个真正的智能体,具有自身学习、跨模态学习、知识和工具利用等能力。与此同时,AI与人类价值观“对齐”也同样不可忽视,毕竟如果AI的价值观和人的价值观背道而驰,那将会是非常危险的。
《21世纪》:AI未来的发展方向是如何的?
邱锡鹏:以前一直做的人工智能模型都是弱人工智能模型,比如AlphaGo只能下围棋。目前ChatGPT的表现类似于通才,但是它可能在细分的专业性上和行业中比较顶级的专家还有很大的差距。我认为它将来会有不同的分支,往不同的专业方向上发展,以大模型为基础,产生很多的分领域的不同模型。这对于之前的人工智能研究来说应该都是一个大的颠覆。
《21世纪》:中国如何在这场科技浪潮中抓住机会?
邱锡鹏:我是比较乐观的。我们的AI以场景的丰富度或者应用层面的创新性领先,在AIGC或者大模型浪潮中,应用驱动也是很重要的。有了底座之后,我们再去把AI产品打磨好,这些应用场景的数据在我们国内是非常丰富的。
(文章来源:21世纪经济报道)
标签:
精彩推送
- 专访复旦大学MOSS系统负责人邱锡鹏:ChatGPT的革命性体现在大模型的“涌现能力”
- 当前快讯:今年基建投资将保持韧性 聚焦哪些领域?
- 中央转移支付首破10万亿 钱流向何处?
- 全球聚焦:深圳住宅市场仍处筑底修复阶段 持续受抑的购房需求有望进一步释放
- 全球视讯!《锵锵行天下》第三季豆瓣9.2 优酷持续推出精品文化节目
- 世界讯息:用大模型搞图文推广和活动策划 有赞推出首款AI产品寻找增量
- 当前热点-消费复苏按下快进键 零售商业地产有望持续扩张
- 【世界新视野】河北证监局启动上市公司“聚光灯”专项行动
- 【播资讯】中蒙最大陆路口岸今年一季度开行中欧班列736列 货值116亿元
- 天天速看:天猫淘宝再重组 调整架构就能拉电商巨头一把吗
- 天天视讯!三元推出三款新国标产品
- 今头条!拟恢复按实际房租提取!北京租房提取公积金新政采纳公众意见
- 世界资讯:C站日报 | 美团将上线团购配送业务;京东物流进行新一轮组织调整
- 每日关注!李想幕后攒局,车圈再添一个“虚头巴脑”的IPO
- 【全球快播报】央行上海总部:一季度个人定期存款增加2797亿元 同比多增1711亿元
- 薪资集体大降,带货主播不香了?
- 北京农商银行与首开集团签署战略合作协议
- 江苏银保监局:引导银行保险机构合理增加消费信贷投放
- 环球热点!理想多类车规级芯片正在筹备 但AI芯片一号位骄旸被曝已加入三星
- 银保监会:具备大学本科及以上学历或学位的人员可报名参加精算师职业资格考试
- 【环球聚看点】内蒙古布局村级物流综合服务全覆盖
- 数据复盘|32股获主力加仓超亿元 北向资金抢筹五粮液、迈瑞医疗等
- 环球短讯!清华大学新设“攀登计划” 面向中学生选拔物理人才
- 央行上海总部:一季度人民币存款增加4341亿元 同比多增1781亿元
- 焦点快看:央行上海总部:一季度人民币贷款增加3975亿元 同比多增516亿元
- 拆解国产大模型混战:密集发布原因何在?算力受限怎么解决?
- 观焦点:国家产融合作平台助企融资突破5000亿元
- 全球播报:开播就破亿,海底捞凭什么成抖音带货“顶流”?
- 焦点关注:湖北服务市场主体政策再“接力”:设立消费贷500亿元 多举措提振消费活力
- 世界热点!美团企业版发布 涵盖餐饮、差旅等服务
- 国家卫健委:76个国家区域医疗中心已获批 填补300余项省域医疗技术空白
- 【聚看点】我国绿色港口建设取得突破 未来可借鉴欧洲发展经验
- 第四届联合国世界数据论坛4月24-27日在杭州举办,聚焦提高数据公信力等
- 环球百事通!IMF最新报告:疫情后财政前景仍然复杂 为应对下行风险各国应做好政策准备
- 天天微动态丨权威部门话开局 | 市场监管总局:进一步促进公平竞争 破除地方保护和行政垄断
- 文旅部就《剧本娱乐管理暂行规定(征求意见稿)》公开征求意见
- 一季度中法贸易额创历史同期新高
- 世界热推荐:多家“京籍”上市公司亮相第三届消博会
- 世界即时看!监管要求加强银行保险机构安全保卫工作 全面排查安全风险隐患
- 每日时讯!连云港海州:税惠激发文旅经济活力
- 工业软件国产化加速 广东可发挥制造大省应用发展优势
- 全球热文:人民金融·创新药指数涨0.48% | 中西界限正被打破 中药巨头跨界创新药
- 滴滴发布自动驾驶概念车DiDi NEURON 集成机械臂功能
- 环球即时看!中钢协:4月上旬21个城市5大品种钢材社会库存1218万吨
- 世界通讯!一宗抢爆熔断,一宗国企兜底!广州土市再现“冰火两重天”
- 最新资讯:首份权益基金一季报出炉 份额激增256% 基金经理称半导体行情未充分演绎
- 世界滚动:上海一季度新增首店46家,这三个趋势值得关注
- 当前简讯:惠誉:预期楼市温和回暖势头将在第二季度延续
- 市场监管总局:进一步细化互联网平台反垄断监管具体规则 提升常态化监管水平
- 【世界速看料】陆河外国语学校校园招聘启事
- 【世界新视野】一张票卖21万元,谁在炒演唱会门票?
- 跨国企业为何持续“加仓”中国市场?
- 世界视点!品牌出海打价格战,“低价大潮”能有多大势能?
- 环球快消息!没开会员看剧需看3000秒广告?优酷称版本未升级或账号未登录 网友:充了会员也有广告
- 2022年我国产权市场交易额再创新高 达22.5万亿元
- 徐峥参加综艺节目 网民留言:不建议!浙江广电:其未被定性为劣迹艺人
- 热头条丨大北农与中国农业科学院哈尔滨兽医研究所签订全面战略合作协议
- 吉林省发布扩种大豆油料工作方案:2023年确保大豆播种面积达492.8万亩
- 每日头条!因门口放水碗,这家店火了一年,门店如何制造“宠物流量密码”?
- 房地产业新发展模式下住房租赁如何突破创新?专家们这样说
- 短讯!地一线 | 保利摘地!珠光灯饰城地块出让!两大楼盘成功补证
- 世界快资讯:家族信托行业先导优势稳固 山东国信举行2022年年度业绩发布会
- 中国与RCEP成员国贸易一季度同比增长7.3% RCEP将于今年6月全面生效
- 【全球报资讯】赵伟:“冰火两重天”数据,透露的经济线索
- 【速看料】国内商品期市日间盘涨跌不一 液化石油气领涨超3%
- 精彩看点:让年轻人馋哭的淄博烧烤,怎么突然火起来了?
- 全球微资讯!香港创新科技及工业局局长孙东答21记者:高度重视数码转型 通过web3.0探索及巩固香港国际金融中心地位
- 天天快讯:音悦台宣布回归 App现已开放下载
- 土地财政发展模式难以为继 未来是转型还是终结?
- 【天天报资讯】陕西安康高新区:年底前购新房契税补贴50% 鼓励企业团购
- 万达美华酒店将入驻大理云麓青城万达广场
- “偿二代二期”下首份SARMRA评估结果出炉:40家险企评分上升 7家得分不足70
- 【专访】毕马威:新能源强配储经济性不显著 影响储能更快发展
- 环球动态:Swift探索CBDC互连方案 为多货币形态金融市场铺平道路
- 【世界新要闻】陕西安康高新区:年底前购新房契税补贴50% 鼓励企业团购
- 天天速讯:香港创新科技及工业局局长孙东答21记者:今年下半年将正式开展100亿港元“产学研1+计划”
- 【天天速看料】陕西证监局公开2022年陕西辖区市场发展和监管工作情况
- 最资讯丨浙江去年个人债务清理涉案近60亿元,小老板破产后兼职开网约车还债
- 2023年演出市场井喷 大麦2月—3月销售演出场次是2019年同期3倍
- 浙江去年个人债务清理涉案近60亿元,小老板破产后兼职开网约车还债
- 陕西证监局公开2022年陕西辖区市场发展和监管工作情况
- 当前滚动:行业风向标 | 降本增效前景向好 AI+医药“点燃”行业新方向
- 焦点热门:香港创新科技及工业局局长孙东答21记者:今年下半年将正式开展100亿港元“产学研1+计划”
- 渝论 | 读懂“建议专家不要建议”背后的期许
- 天天快消息!一线珠江久侯 中国铁建·西派粤府全球首发 致敬世界广州
- 盘点河南上市消费企业,中部崛起效应影响几何?
- 文化和旅游部:“五一”假期预订高峰已经提前到来 预计民众出游需求将强劲释放
- 微资讯!新茶饮下场做咖啡,咖啡“奶茶化”能讲出新故事吗?
- 文化和旅游部:“5.19中国旅游日”将推出文旅消费券等一系列线上线下旅游惠民活动
- 国家邮政局:3月中国快递发展指数为307.7 同比提升22.5%
- 海关总署:1-3月稀土出口11837.2吨 同比降6.6%
- 【全球热闻】央行公开市场连续小额净投放 本月MLF有望超量续作
- 生存仍是头等大事,房企融资开足马力
- 全球速讯:资本下注、行业拥挤,咖啡品牌还能翻出多大浪花?
- 重庆高速投资实现“开门红” 一季度累计完成投资83亿元
- 每日观点:国家邮政局:3月中国快递发展指数为307.7 同比提升22.5%
- 天天快资讯:央行公开市场连续小额净投放 本月MLF有望超量续作
- 黄埔知识城一批大项目蓄势待发!版块新盘2字头起
- SensorTower:3月腾讯《PUBG Mobile》海外收入环比增长26%
- 速看:海关总署新闻发言人、统计分析司司长吕大良:外贸向好势头有望进一步延续