大模型激战半年:王小川进击、王慧文退场,腾讯字节姗姗来迟
2023-08-13 20:47:08来源:时代财经
图片来源:Pixabay
国产通用大模型的混战远未结束。在半年左右的蛰伏期过后,大部分玩家都浮出了水面。
(资料图片)
在这之中,有人加速迭代。8月8日,由搜狗搜索创始人王小川创立的百川智能发布了旗下第三款大模型产品Baichuan-53B,背后训练参数高达530亿。此时距离王小川宣布进军大模型战场不过4个月的时间,这家创业公司进展神速。
这还只是一个开始,百川智能方面向时代财经透露,后续还会有多款产品发布,包括规模更大、参数超千亿的大模型。
也有人黯淡退场。由美团联合创始人王慧文创立,吸引源码资本、五源资本等知名VC机构,以及美团创始人王兴、快手创始人宿华等互联网大佬投资的光年之外,曾一度被市场认为是国内大模型战场上最强有力的玩家之一。
然而,随着6月下旬王慧文因健康问题离岗退出,无法继续执掌光年之外,这家备受期待的大模型创业公司只能卖身美团,一众投资人也随之退股。
还有人另辟蹊径。AI大牛周明创立的澜舟科技,强调轻量化模型,希望用更低的成本解决B端场景问题。而曾帮助谷歌将BERT模型的训练时间从3天降到76分钟的新加坡国立大学校长青年教授尤洋,则成立了潞晨科技,试图用低成本训练大模型的解决方案突围。
相比之下,大厂自研的大模型则姗姗来迟。直到8月初,腾讯自研的混元大模型和字节打造的AI对话类产品Grace才先后传出内测消息,具体面世时间仍未可知。
同样停留在测试阶段的,还有李开复创立的AI 2.0企业“零一万物”。在7月3日举办的对外交流会上,李开复透露,该公司在三个月内已实现百亿参数规模的模型内测,目前正向300亿—700亿参数规模扩大。不过,该产品至今仍未向市场开放。
这些仍未发布的大模型产品将为科技行业带来什么样的改变,值得市场期待。从这个角度来看,这场混战或许还要持续很久。
进击的王小川
由王小川创立的百川智能,正以其惊人的产品发布速度吸引市场的关注。
在其4月宣布下场做大模型后,仅用了两个月零五天的时间,就在6月15日发布70亿参数开源大模型Baichuan-7B。不到一个月时间,又发布了130亿参数开源大模型Baichuan-13B。
8月8日发布的Baichuan-53B,已经是这家大模型创业公司半年内发布的第三款产品,百川智能进展神速。
百川智能相关负责人回复时代财经表示,公司在创立之前就已经花了很多时间做前期准备,开始就把路线和方法想得比较清楚。
其指出,做大模型都会考虑三个层面:数据、算法和算力。抛开算力不说,做搜索的公司天然有优秀的数据能力,百川智能的核心团队此前已经做了20年的数据抓取、抽取、清洗、去重、反垃圾等操作,可以更快拿到高质量数据集。
而算法是以自然语言处理为中心,将算法工程进行迭代,不是单一的工程问题,而是在文本数据驱动下,算法和工程共同运行。此前在搜索领域积累的经验在这里也能很好地发挥作用,利用数据评价推动模型进步。
“有了之前多年的技术和经验积累,百川智能做大模型产品的速度才会又快又好。”
不过,在发布会上,王小川亦指出,当下国产通用大模型仍处在一个分型复刻的阶段。各家厂商基本都在对标OpenAI,不可避免地会出现同质化的问题。
正因如此,在他看来,与美国闭源大模型的头部格局已定的情况不同,“中国谁的大模型最好”现在并没有结论。在这场混战之中,钱是重要的,但最终决定的力量还是人和团队、组织能力。大厂钱多、人多、算力多,但组织效率通常不一定够好,创业公司的组织效率可能好,也可能不好。
“大家都在争取机会,而且不一定落在大厂里。”
王小川还在采访中谈及退场的王慧文。其指出,王慧文是国内几个主流做大模型里唯一一个没有强势技术背景的,对他的挑战比其他家要大。工作中要做大量的技术决策,招什么人、走什么技术路线图、需要多少计算资源,一定会面临非常多的决策压力。
“不是做大模型压力大,是没有技术背景做决策压力会大很多。但是技术足够的话,其实挺愉悦的。”
腾讯、字节姗姗来迟
大模型混战开启之初,互联网大厂因为坐拥更多算力、人才、资金和数据,被认为是强大的竞争对手。
百度自研的文心一言早在今年3月底就已率先落地;阿里打造通义千问紧随其后,在4月11日举办的阿里云峰会上揭晓。就在阿里发布通义千问的前一天,王小川才刚刚宣布下场,成立百川智能。
相比之下,同为一线大厂的腾讯跟字节,推出通用大模型的步调要慢许多。
8月3日,据36kr报道,腾讯自研的 “腾讯混元大模型”已经进入应用内测阶段。三天后,8月6日,字节旗下的AI对话类产品Grace也被爆出历经两个月的研发后,终于进入测试阶段。
此时距离百度发布文心一言已经过去4个月。对于腾讯通用大模型产品步调稍慢的原因,马化腾曾公开表示,“腾讯也一样在埋头研发,但是并不急于早早做完,把半成品拿出来展示。”
不过,“并不着急”的腾讯,还是在今年6月中旬率先公布了“行业大模型”的路线,一口气抛出10大行业超过50个解决方案。无独有偶,字节跳动也同样在6月发布大模型服务平台“火山方舟”,通过集成多家AI科技公司及科研院所的大模型,向企业提供全方位的平台服务。
市场曾一度认为,行业大模型将成为这两家大厂突围的方法。
但事实或许并非如此。当下被鼓吹的行业大模型始终存在着被替代的风险。科大讯飞总裁吴晓如曾向时代财经指出,10年前,在语音识别技术上,也曾诞生过诸多聚焦在通话、行车、办公等不同场景的专用模型,但随着通用模型技术的成熟,专用模型也随之退场。
“我认为大模型也会经历一样的阶段。”
相比之下,从更长远角度看,通用大模型才真正代表着一个平台级或颠覆性的大机会。正是因此,腾讯和字节都不可能放任自己错过,哪怕进度缓慢,但它们必定要坚持在场。
有腾讯内部人士向时代财经指出,腾讯的计划一直是两条腿走路,通用和行业齐头并进。只是与一些激进的厂商相比,旗下产品涵盖社交、游戏、广告、内容创作等多个领域的腾讯,要更为谨慎一些。
学院派创业者另辟蹊径
在大模型战场上,来自高校、研究机构的学院派创业公司组成了竞争的第三极。
它们既不是王小川、王慧文这样的种子选手,在创业之初就能凭借人脉吸引到数亿美元的投资,并以此迅速起步。也不像腾讯、阿里、百度这样的大厂,在算力、人才、资金等各个方面都占据难以逾越的优势。
但凭借着他们对于人工智能技术的深度理解,这些创业者仍然能在夹击之下,另辟蹊径找到新的发展方向。
比如由原微软亚洲研究院副院长周明创立的澜舟科技,不同于市面上一众追逐千亿乃至万亿参数的大模型产品,这位从1980年就开始研究NLP(自然语言处理)的华人AI大牛希望以更轻量级模型解决B端场景的问题。
其推出的孟子大模型曾以十亿参数,刷新此前被百亿、千亿级别参数模型轮番霸榜的中文语言理解权威评测基准 CLUE 榜单。
这是一项务实的决策。出于数据安全考虑,绝大部分企业都不会将数据上传,而是会要求本地化部署,成本因此被显著拉高。在接受媒体采访时,周明指出,哪怕只是本地部署推理,拿训练好的大模型来用,千亿参数大模型也需要8到16块 A100,换算下来至少是一两百万元的投入,“对很多场景来说,客户需要便宜和够用”。
由新加坡国立大学校长青年教授尤洋创立的潞晨科技,则希望利用算法技术降低大模型的调用成本。
现如今,无论是大厂,还是创业公司,都必须面对国产大模型同质化趋势愈发明显的问题。如果这一问题不被解决,未来大模型极有可能陷入当下云服务厂商面临的低毛利困境。
尤洋对时代财经表示,这是因为底层技术基座迭代成本过于高昂。他以GPT举例,OpenAI每一次的训练成本高达6000万美元,每隔三四个月就需要训练一次,迭代一次则需要四五次训练。以此计算,每迭代一次技术基座可能需要2亿到3亿美元。
过于高昂的成本导致市场上的技术基座极其稀缺。基本上只有GPT、LLAMA,还有国内的GLM。各家厂商基本都是在模仿这几家大模型做产品,才导致了同质化的问题愈发凸显。
长期研究高性能计算的尤洋因此成立了潞晨科技。该公司目前推出的开源系统Colossal-AI 可通过高效多维并行、异构内存等技术,显著降低AI大模型训练、微调和推理的开发与应用成本。
尤洋认为,只有伴随大模型训练成本快速下降,或者采取更好的优化技术,使得参数控制在200亿左右,还依然能够达到和千亿参数一样的效果时,才会真正迎来大模型百花齐放的那一天。
责任编辑:hnmd003
相关阅读
相关阅读
-
大模型激战半年:王小川进击、王慧文退场,腾讯字节姗姗来迟
图片来源:Pixabay国产通用大模型的混战远未结束。在半年左右的蛰伏期
-
法尔克:拜仁拒绝了曼联对帕瓦尔的首份报价
直播吧8月13日讯法尔克消息,拜仁拒绝了曼联给帕瓦尔的首份报价。法尔
-
dnf骑士莱恩宠物附魔叫什么 dnf骑士莱恩怎么进化
dnf骑士莱恩宠物附魔叫做宠物加持,它可以为宠物增加属性和技能,提升
-
受强降雨影响 辽东沿海流域碧流河茧场站超警戒水位0.38米
辽宁省辽东沿海流域部分河流出现涨水过程:营口市熊岳河、鞍山市大洋河
-
莫言账号被封?B 站:传谣博主已被禁言
8月13日,B站发布公告称莫言作家账号被封是谣言。B站在微信公众号发文
-
19岁婚嫁险一年要交多少?怎么交?
视具体情况而定。 首先,我们需要了解19岁婚嫁险的保费计算方式。一般
-
团建意外险多少钱?怎么买?
一般来说,团建意外险的价格在每人每天几元到几十元不等。 团建意外险
-
终身寿险是什么意思?有哪些产品?
终身寿险是一种长期保障性质的寿险产品,它提供终身的保险保障。 与其
-
商业意外险影响应届生身份吗?如何购买呢?
不影响。商业意外险是一种保险产品,旨在为被保险人在意外事故发生时提
-
重疾险包不包括意外险?要如何选择购买呢?
不包括,重疾险和意外险是两种不同的保险,它们有着不同的保障范围和赔
-
中国光大银行原党委副书记、副行长张华宇受贿案一审公开宣判
2023年8月11日,山东省菏泽市中级人民法院对中国光大银行股份有限公司
-
电烧伤皮肤用什么药好得快(电烧伤)
1、触电、雷击均可引起电烧伤。2、电击伤轻者仅有一过性神志丧失、头晕
-
婚嫁保险中途退能退多少?怎么退?
可以。 首先,我们需要明确一点,婚嫁保险是一种长期保险产品,通常保
-
重疾险交多少年可以返还?买哪种类型的好呢?
重疾险的返还期限是根据不同保险公司的产品设计而定的。一般来说,重疾
-
企业给员工买意外险的好处有哪些?是怎么买的?
首先,企业给员工买意外险可以提高员工的工作积极性和幸福感。员工是企
-
健康福星增额终身重大疾病保险怎么样?有什么亮点?
总体看来还不错。 健康福星增额终身重大疾病保险保障内容还是比较充分
-
重疾险生效多长时间可以理赔?怎么理赔?
视具体情况而定。 1 合同生效即可理赔。有些重疾险产品在合同生效后即
-
临电“转正” “电”亮百姓美好生活
“感谢你们的优质服务,让我们小区的临电问题终于得到解决。”近日,包
-
广东海事局发布航行警告:8月14日南海海域预计有火箭残骸落区
据中国海事局网站消息,广东海事局发布粤航警136 23,南海,8月14日13
-
快手公开 AIGC 方案,助力短视频创作全流程提效
日前,快手方面在上海召开了以热爱,让收获更多为主题的2023快手光合创
-
iTunes Movie Trailers 将会全面并入 Apple TV
日前有消息显示,苹果方面已更新了iTunesMovieTrailers应用,并在顶部
-
维珍银河日前已完成首次商业载人太空旅行任务
此前在今年6月,太空旅游公司维珍银河完成代号为Galactic01的发射任务
-
忘掉碧桂园!万科突然宣布!!
01天雷滚滚,一个接一个。这几天地产圈又一次炸锅了。先是碧桂园突然宣
-
丰田正考虑推出插混 / 燃料电池 / 纯电版普拉多车型
IT之家8月13日消息,据外媒AutomotiveNews本周六报道,丰田汽车在8月2
-
电信诈骗,怎样骗走我 100 万?
诈骗套路千千万,总有一个坑到你。定焦(dingjiaoone)原创作者|向园布
-
《永劫无间》受身博弈机制一览
一个游戏中,最令人感到困扰的就是遇到《永劫无间》受身博弈机制一览,
-
荷的多音字的组词是什么(ldquo 荷 rdquo 的多音字组词有哪些)
1、[hé]荷花荷包荷塘荷钱荷得紫荷芋荷荷宠扬荷荷眷膺荷荷睠媿荷所荷荷
-
买终身重疾险好不好?怎么买?
看自己的实际情况选择。重大疾病不仅给患者本人带来了身体上的痛苦,还
-
儿童意外险能赔付多少钱?怎么赔付?
儿童意外险的赔付金额是根据保险合同中约定的赔付标准来确定的。一般来
-
学生意外险多久可以报销打款?怎么报销?
视具体情况而定。 学生意外险的报销时间因保险公司而异,一般来说,学
精彩推荐
阅读排行
精彩推送
- 重疾险如何购买才最划算呢?要交...
- 意外险可以买当天的吗?怎么买?
- 王传福哭着要在一起,但长城想打...
- 沙漠上的一个个“神秘怪圈”,真...
- 小米 MIX Fold 3 公布首支产...
- iPhone 14 电池为啥如此不耐用...
- 电影市场冰火两重天:票房爆火创...
- 沙特豪门拼了!6个月3输决赛,全...
- 二级建造师合格分数线各地区 二...
- 当天生效的运动意外险有哪些?在...
- 员工意外险理赔流程是什么?要注...
- 深圳政府30元重疾险保障范围是什...
- 60万的意外险多少钱一个月啊?怎...
- 平安智慧星意外险报销比例是多少...
- 488家药企去年销售费用超3000亿...
- 上汽通用五菱周钘:宝骏品牌明年...
- 网友称岳阳机场停车场禁止特斯拉...
- AIGC+ 游戏:一个被忽视的长赛道
- 日本年轻人远离“铁饭碗”:全国...
- 建议帮帮碧桂园、龙湖等优质民营...
- 房本满两年和满五年的区别(买二...
- 50岁的老寡妇真以为自己是处女,...
- 人寿的重疾险可以退吗?怎么退?
- 重疾险的坑有哪些?多少钱?
- 公司意外险多少钱一个月?有什么...
- 365元意外险保障范围包含哪些?...
- 虎牙大变局:营收颓势下初创团队...
- 重疾险延迟缴费会被停吗?有什么...
- 网红鱼鳞坝的“致命”危险
- 一边是产量高增长,一边是促销卷...