拆解国产大模型混战:密集发布原因何在?算力受限怎么解决?
ChatGPT这把火,在国内越烧越旺。
继阿里云“通义千问”在4月11日官宣之后,算上商汤早一天推出的大模型“商量”,百度3月份的“文心一言”,国内已正式上线了三家大语言模型。
而坊间相关消息仍如雨后春笋,甚至有不少模型已是有名有姓,粗略数来多达六七家。
(资料图片仅供参考)
短短三个月内,国内头部厂商扎堆挤上赛道,密集上线大语言模型,这到底是各家的技术创新集中爆发,抑或只是出于市场竞争压力?在国内GPU仍整体受限的情况下,缺乏算力支持的大语言模型领域为何看似一片繁荣?这波ChatGPT国产浪潮如何直面海外竞争,又将去往何方?
大模型已上线三家,超五家背后排队
我们先来梳理一下国内大语言模型赛道的现状。
国内关于大语言模型的最早一批消息在今年年后。2月9日,科大讯飞向媒体透露,其AI学习机、讯飞听见等将成为公司类ChatGPT技术率先落地的产品,具体将于5月6日发布。
3月中旬,百度率先推出了“文心一言”,正式开启国内科技企业的较量。
不久后,在3月29日的2023数字安全与发展高峰论坛上,360创始人周鸿祎以彩蛋形式披露自家GPT类模型Demo,现场用360浏览器演示了智能搜索场景,还对其中的部分回答内容“点踩”,表示并不满意。同时,周鸿祎戏称此次演示只是把“孩子抱上给大家看看”,并不是要发布中国版ChatGPT。
3月31日,有消息称网易有道的教育场景下类ChatGPT模型“子曰”将于近期推出,基于“子曰”大模型研发的AI口语老师和中文作文批改DEMO已完成,将在近期开放内测。
4月8日,京东集团副总裁何晓冬在人工智能大模型技术高峰论坛上也透露,京东将在今年发布新一代大模型“ChatJD”,定位为产业版本ChatGPT。
4月10日,旗下拥有浏览器Opera、社交娱乐平台StarX等产品的互联网平台出海企业昆仑万维官方宣布,其与奇点智源合作自研的国产大语言模型——「天工」3.5即将发布,并于4月17日启动邀请测试。
而在近日,华为云官网下的“盘古”系列的NLP(自然语言处理)大模型、CV(机器视觉)大模型、科学计算大模型被标注为即将上线状态,外界猜测这意味着华为即将加入大模型竞赛。
甚至短视频与信息分发领域的王者,字节跳动也被曝年初就已开始组建专门的大模型团队。其中大语言模型方向由字节搜索部门牵头。还有消息称,原阿里达摩院科学家,超大规模多模态预训练模型M6的技术负责人杨红霞已加入该团队。
国产大模型多为ToB,且“每家必备”
纵览上述信息,这波国产大语言模型浪潮的第一个显著特点自然浮出水面——
当前,国产大语言模型均未对公众大面积开放,也没有明确的ToC(面向公众)入口,未来发展大多也走ToB(面向企业)路线。
当前已正式上线的三家中,百度、商汤有关负责人曾向南都记者表示,自家大模型为toB产品。阿里方面在4月11日举办的阿里云峰会上也宣称,未来“通义千问”将主要面对企业定制个性化服务。
而在已有消息的几家中,科大讯飞、网易有道两家皆已透露了基于公司类GPT技术所要落地的产品;京东的“ChatJD”明确定位为产业版本ChatGPT;华为虽未透露更多大模型信息,但其模型所属的“盘古”系列早在2021年就已上线。
而根据华为云人工智能领域首席科学家田奇在2023年人工智能大模型技术高峰论坛上的演讲,“盘古”系列下的NLP大模型主要面向智能文档搜索、智能ERP(企业资源计划系统)、小语种大模型等行业,多处理类案检索、企业财务异常检测等商业场景。
因此,整体看来,国内大语言模型赛道的公司在开发模型后,更倾向于将相关模型嫁接到自家的C端服务中,或者走私有化部署、企业定制等路线。
2023年人工智能大模型技术高峰论坛田奇演讲
而在与海外相同赛道的公司对比之后,不难得出第二个特点——相比海外,国内厂商更倾向于“每家必备”一个大模型。
当前,海外头部科技公司如OpenAI、谷歌等,其开发都以基础模型(Foundation Models)为主,不管是ChatGPT、Gpt4,还是PaLM-E,都是类似AI基础设施的基础大模型。其他公司,要么索性走开源社区的路线,要么像美国云服务巨头Salesforce一样,直接与OpenAI合作接入ChatGPT使用。在某种程度上,可以说是“大家都在规定范围里各自赚钱”。
国内的互联网生态则不同。中科深智创始人兼CEO成维忠向南都记者表示,国内但凡涉及数据等核心能力,哪怕一个公司再小,也一定会为自己建设一套完整系统或是框架,这可能是出于“互相抢夺市场以固定地盘”的需要。因此,国内基于大数据等核心能力的服务本身是割裂的,其规模效应也远远赶不上美国同类企业。
“比如刚才说的Salesforce已经是ToB领域中的世界级公司了,但如果中国有Salesforce的话,它一定会自己做个大模型。”成维忠说。
基于这种“每家必备”的特点,成维忠认为,当前国产ChatGPT的浪潮更可能是一种“市场行为”,也就是说,国内企业更倾向自己独立做一个大模型,并不考虑用其他方服务。而如此密集的上线行为,或是出于资本市场的压力。
“从公司战略角度来说,不太可能急赶急地推出大模型,而且很多公司推出的大模型里无所不包,我觉得这在短期其实是做不到的——很大程度上应该还是在回应客户的市场压力,同时很多上市公司也面临着资本市场的压力……当然,ToB或者说私有化部署、定制这条路线对技术的要求也会低一些。”成维忠表示。
国产ChatGPT如何应对海外竞争?
无论是客户需求还是资本压力,AIGC(AI生成式内容)、大语言模型显然已成为一块价值飙升的市场,那么,紧锣密鼓上线的国产ChatGPT们,是否将直接面对来自全球的激烈竞争?
在成维忠看来,竞争毫无疑问已经开始,且无法避免。因为这是一个类似芯片的市场,对于最终应用的能力影响极大。尤其是在ToB端,基础大模型级别的ChatGPT、GPT4,偏向应用层的Midjourney、Stable Diffusion对于企业来说都已经是被市场验证过的,效果极佳的工具,那么在这种情况下,国内市场被主流大模型及应用侵蚀掉一部分就是必然的。
不过,技术产品要抢夺海外市场,绕不开数据安全、数据保密等问题。不久前,意大利就宣布封禁ChatGPT,德国、法国、爱尔兰、西班牙等国家也紧随其后,开始考虑对AI聊天机器人采取更严格的监管。
出于这方面原因,昆仑万维CEO方汉认为,海外的AI模型进国内市场首先需要合规,还会牵扯到很多隐私和数据安全问题,因此对于这一赛道,海内外企业其实很难直接发生竞争。
在谈到涉及大模型开发的另一重要影响因素——算力时,方汉坦言,当前国内确实还处在一个GPU整体受限的情况下,之所以当前大语言模型能呈现出一种比较繁荣的景象,是因为目前国内还有不少存量GPU,足以支撑目前这一波的大语言模型训练。
“当然,如果制裁长期持续,肯定会对后续的大模型训练造成影响,不过现在国产的训练芯片也在迅速发展,像华为、寒武纪、阿里等等都可以作为替代。而且,就算计算硬件不行,只要软件优化能跟得上,我觉得大模型领域仍然会持续进行高速发展。”
大语言模型,出路在何?
书到最后,两位资深从业者也向南都记者描述了大语言模型的未来。
方汉认为,大语言模型将深刻影响两个方面。
第一,非常基础的互联网应用“搜索”。事实上,“搜索”已经近20年没有出现过大的变革,其基本的流程也就是用户打开对话框,输入关键词获取结果,业界这些年也一直都在卷搜索速度、精准度等等。但现在,大语言模型彻底改变了“搜索”——以前是打开搜索引擎获取所需信息,现在可能就会打开大模型,或是集成了大模型的搜索引擎,不仅能获取所需信息,还能通过持续不断的对话不断精确答案。
第二,方汉认为,大模型改变的并非一个独立的应用市场,而会对现有的全部应用市场进行改造。对此,成维忠补充表示,在ChatGPT火了之后,其实很多人都忽略了OpenAI推广的Plugins.它整合一系列第三方工具,其中包括不少企业应用、图像处理等多方面的插件,能够帮助用户人员更轻松通过ChatGPT调用第三方工具软件。
“这就相当于打造一个超级入口,在未来,可能各式各样的App应用都能接入或者被接入ChatGPT,这就有可能永久地改变整个互联网的生态。”成维忠说。
再回看这次国产大模型浪潮,成维忠认为,即使在未来能赶上主流模型的差距,也不会像美国那样呈现出OpenAI一家赋能其他科技巨头的趋势,更可能变成若干个大厂一起服务中小型企业和传统企业——这就使得中国出现一个大模型的经济回报远小于海外。
那么,这次国产大模型浪潮还能持续多久?在成维忠看来,这就得看各家的“信仰”了。因为这不是一个单纯的技术问题,而是一个巨大的、持续的投资决策,到底哪些公司有决心一直投入下去,还很难判断。
(文章来源:南方都市报·湾财社)
标签:
精彩推送
- 拆解国产大模型混战:密集发布原因何在?算力受限怎么解决?
- 焦点关注:湖北服务市场主体政策再“接力”:设立消费贷500亿元 多举措提振消费活力
- 世界热点!美团企业版发布 涵盖餐饮、差旅等服务
- 国家卫健委:76个国家区域医疗中心已获批 填补300余项省域医疗技术空白
- 【聚看点】我国绿色港口建设取得突破 未来可借鉴欧洲发展经验
- 第四届联合国世界数据论坛4月24-27日在杭州举办,聚焦提高数据公信力等
- 环球百事通!IMF最新报告:疫情后财政前景仍然复杂 为应对下行风险各国应做好政策准备
- 天天微动态丨权威部门话开局 | 市场监管总局:进一步促进公平竞争 破除地方保护和行政垄断
- 文旅部就《剧本娱乐管理暂行规定(征求意见稿)》公开征求意见
- 一季度中法贸易额创历史同期新高
- 世界热推荐:多家“京籍”上市公司亮相第三届消博会
- 世界即时看!监管要求加强银行保险机构安全保卫工作 全面排查安全风险隐患
- 每日时讯!连云港海州:税惠激发文旅经济活力
- 工业软件国产化加速 广东可发挥制造大省应用发展优势
- 全球热文:人民金融·创新药指数涨0.48% | 中西界限正被打破 中药巨头跨界创新药
- 滴滴发布自动驾驶概念车DiDi NEURON 集成机械臂功能
- 环球即时看!中钢协:4月上旬21个城市5大品种钢材社会库存1218万吨
- 世界通讯!一宗抢爆熔断,一宗国企兜底!广州土市再现“冰火两重天”
- 最新资讯:首份权益基金一季报出炉 份额激增256% 基金经理称半导体行情未充分演绎
- 世界滚动:上海一季度新增首店46家,这三个趋势值得关注
- 当前简讯:惠誉:预期楼市温和回暖势头将在第二季度延续
- 市场监管总局:进一步细化互联网平台反垄断监管具体规则 提升常态化监管水平
- 【世界速看料】陆河外国语学校校园招聘启事
- 【世界新视野】一张票卖21万元,谁在炒演唱会门票?
- 跨国企业为何持续“加仓”中国市场?
- 世界视点!品牌出海打价格战,“低价大潮”能有多大势能?
- 环球快消息!没开会员看剧需看3000秒广告?优酷称版本未升级或账号未登录 网友:充了会员也有广告
- 2022年我国产权市场交易额再创新高 达22.5万亿元
- 徐峥参加综艺节目 网民留言:不建议!浙江广电:其未被定性为劣迹艺人
- 热头条丨大北农与中国农业科学院哈尔滨兽医研究所签订全面战略合作协议
- 吉林省发布扩种大豆油料工作方案:2023年确保大豆播种面积达492.8万亩
- 每日头条!因门口放水碗,这家店火了一年,门店如何制造“宠物流量密码”?
- 房地产业新发展模式下住房租赁如何突破创新?专家们这样说
- 短讯!地一线 | 保利摘地!珠光灯饰城地块出让!两大楼盘成功补证
- 世界快资讯:家族信托行业先导优势稳固 山东国信举行2022年年度业绩发布会
- 中国与RCEP成员国贸易一季度同比增长7.3% RCEP将于今年6月全面生效
- 【全球报资讯】赵伟:“冰火两重天”数据,透露的经济线索
- 【速看料】国内商品期市日间盘涨跌不一 液化石油气领涨超3%
- 精彩看点:让年轻人馋哭的淄博烧烤,怎么突然火起来了?
- 全球微资讯!香港创新科技及工业局局长孙东答21记者:高度重视数码转型 通过web3.0探索及巩固香港国际金融中心地位
- 天天快讯:音悦台宣布回归 App现已开放下载
- 土地财政发展模式难以为继 未来是转型还是终结?
- 【天天报资讯】陕西安康高新区:年底前购新房契税补贴50% 鼓励企业团购
- 万达美华酒店将入驻大理云麓青城万达广场
- “偿二代二期”下首份SARMRA评估结果出炉:40家险企评分上升 7家得分不足70
- 【专访】毕马威:新能源强配储经济性不显著 影响储能更快发展
- 环球动态:Swift探索CBDC互连方案 为多货币形态金融市场铺平道路
- 【世界新要闻】陕西安康高新区:年底前购新房契税补贴50% 鼓励企业团购
- 天天速讯:香港创新科技及工业局局长孙东答21记者:今年下半年将正式开展100亿港元“产学研1+计划”
- 【天天速看料】陕西证监局公开2022年陕西辖区市场发展和监管工作情况
- 最资讯丨浙江去年个人债务清理涉案近60亿元,小老板破产后兼职开网约车还债
- 2023年演出市场井喷 大麦2月—3月销售演出场次是2019年同期3倍
- 浙江去年个人债务清理涉案近60亿元,小老板破产后兼职开网约车还债
- 陕西证监局公开2022年陕西辖区市场发展和监管工作情况
- 当前滚动:行业风向标 | 降本增效前景向好 AI+医药“点燃”行业新方向
- 焦点热门:香港创新科技及工业局局长孙东答21记者:今年下半年将正式开展100亿港元“产学研1+计划”
- 渝论 | 读懂“建议专家不要建议”背后的期许
- 天天快消息!一线珠江久侯 中国铁建·西派粤府全球首发 致敬世界广州
- 盘点河南上市消费企业,中部崛起效应影响几何?
- 文化和旅游部:“五一”假期预订高峰已经提前到来 预计民众出游需求将强劲释放
- 微资讯!新茶饮下场做咖啡,咖啡“奶茶化”能讲出新故事吗?
- 文化和旅游部:“5.19中国旅游日”将推出文旅消费券等一系列线上线下旅游惠民活动
- 国家邮政局:3月中国快递发展指数为307.7 同比提升22.5%
- 海关总署:1-3月稀土出口11837.2吨 同比降6.6%
- 【全球热闻】央行公开市场连续小额净投放 本月MLF有望超量续作
- 生存仍是头等大事,房企融资开足马力
- 全球速讯:资本下注、行业拥挤,咖啡品牌还能翻出多大浪花?
- 重庆高速投资实现“开门红” 一季度累计完成投资83亿元
- 每日观点:国家邮政局:3月中国快递发展指数为307.7 同比提升22.5%
- 天天快资讯:央行公开市场连续小额净投放 本月MLF有望超量续作
- 黄埔知识城一批大项目蓄势待发!版块新盘2字头起
- SensorTower:3月腾讯《PUBG Mobile》海外收入环比增长26%
- 速看:海关总署新闻发言人、统计分析司司长吕大良:外贸向好势头有望进一步延续
- 一季度我国进出口增速呈现逐月向好态势
- 焦点速递!助力渝企排查国际经营合规风险 重庆邀专家一对一“把脉”支招
- 世界热点评!工信部反诈专班公布新一批仿冒金融平台 包括360JT、分期L、省贝等
- 热消息:文旅部组织开展2023年文化和旅游消费促进活动
- 国家能源局副局长任志武会见美国霍尼韦尔公司全球高增长区总裁
- 当前焦点!服务区域高质量发展 杭州城西科创大走廊科技金融服务联盟成立
- 世界通讯!人民银行今日开展90亿元逆回购操作 公开市场实现净投放10亿元
- 思科拟在亚特兰大增加700个工作岗位
- 全球动态:确立2025年自主、合资乘用车各200万销量目标:东风公司开启“转型升级三年行动”
- 实测小鹏XNGP智驾系统:行进在无人驾驶前夜 未来要摆脱高精地图
- 【环球新要闻】中信证券:高成长的汽车零部件标的有望穿越牛熊
- 世界热推荐:思科拟在亚特兰大增加700个工作岗位
- 4月13日盘前重要市场新闻
- 环球热资讯!实测小鹏XNGP智驾系统:行进在无人驾驶前夜 未来要摆脱高精地图
- 世界头条:协力冲刺“大考” 海南重点项目建设劈波斩浪
- 天天即时看!上海证券业持续加强投教 去年投入经费超1.3亿元
- 世界热消息:4月13日要闻提示
- 新消息丨海南证监局主动作为服务自贸港建设 推动全面注册制改革在海南走深走实
- 天天热头条丨东吴证券:加息尾声渐进 金价趋势上行
- 全球快消息!协力冲刺“大考” 海南重点项目建设劈波斩浪
- 最新资讯:上海证券业持续加强投教 去年投入经费超1.3亿元
- 今日关注:海南证监局主动作为服务自贸港建设 推动全面注册制改革在海南走深走实
- 天天热资讯!天风证券:维持对家电行业国内复苏及智能家居链条的看好
- 前沿资讯!4条数字经济领域指数发布首日“开门红”
- 世界速递!公募社保联手抓到牛股 QFII抄底赚钱走人
- 河南郸城聚力新兴产业
- 多部门发文进一步支持西部科学城加快建设