李彦宏:开源模型将会越来越落后 | 最前线
36氪
2024-04-17 08:20:20

原标题:李彦宏:开源模型将会越来越落后 | 最前线

“未来,自然语言将成为新的通用编程语言,你只要会说话,就可以成为一名开发者,用自己的创造力改变世界。”

4月16日,百度创始人、董事长兼首席执行官李彦宏在Create 2024百度AI开发者大会上表示。

Create大会是百度自2017年起每年定期召开的开发者大会。会议开始,李彦宏首先晒出了过去一年的成绩单:其中,百度旗下的文心一言用户已超2亿,服务的客户数达到了8.5万,利用千帆平台开发的AI原生应用数超过了19万。

来源:百度

本次发布会的重磅发布,简单而言就是:基础模型全面更新,推出4.0工具版,百度还带来了三大AI开发工具,对应不同的开发场景。

“它们组成了一个工具箱,支持开发者打包带走,随取随用。”李彦宏表示。他表示,自然语言将成为新的通用编程语言,未来,只需要会说话,人人都能成为一名开发者。

回溯文心一言的,百度旗下的“文心一言”基础大模型,在去年就已经经历了多次更新:

  • 2023年3月,文心一言3.0版本,当时主要集中在基础模型的能力之上,包括知识增强、检索增强、对话增强等能力;
  • 2023年5月,文心大模型发布3.5版本,除了基础模型升级能力之后,还进行了精调技术创新、知识点以及逻辑推理能力增强;
  • 2023年10月,文心大模型发布4.0版本,在底层,大模型可以提供超过万卡的算力,而且百度也升级了旗下的开发平台“飞桨”,以及多维数据、多阶段对齐能力。

如今,百度的基础大模型已经有多个版本,包括ERNIE3.5和4.0,和轻量版的ERNIE Speed、Lite、Tiny等尺寸。

相比一年前,新升级的文心大模型4.0,算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。

其中,推理成本的大幅下降,对于大模型降低应用门槛意义最大。也就是说,客户原来如果一天调用模型1万次,现在同样的成本可以调用100万次。

来源:百度

三款新AI开发工具:不懂代码,也能开发智能体和AI应用

“4.0工具版”到底是什么?

过去一年,尽管大模型的能力水平更新日新月异,技术圈时时惊呼“史诗级更新”,但大模型离普通用户的生活依然很远。这次新发布的三款工具,可以看作是文心一言在基础模型之上更进一步:为开发者甚至不懂技术的用户,提供的更多低代码/无代码开发工具。

这次的三款工具分别:智能体开发工具AgentBuilder,AI原生应用开发工具AppBuilder,以及各种尺寸的模型定制工具ModelBuilder。

前两个工具分别对应了不同的开发需求:复杂任务执行、App快速开发;ModelBuilder则是面向专业开发者,需要定制任意尺寸模型的需求。

李彦宏在会场举了大量例子,来说明三款工具的应用场景。

例如:AgentBuilder就是最贴近普通人使用方式的工具。智能体可以批量生成,应用在各种各样的使用场景。

新加坡旅游局Agent开发界面 来源:百度

李彦宏以“新加坡旅游局”举例,如果需要根据为旅游局开发可以规划旅游路线、解答旅游问题、预订门票的“智能体”。只需要用零代码模式,用自然语言和AgentBuilder进行交互,就能够让平台开发一个基础版本。

如果需要更专业的版本,用户可以把新加坡百科词条和官网链接都添加到知识库里,就能实现每天实时更新。另外,百度也在工具中内置了超过25种预置工具,覆盖电商、互娱、办公、专业服务等场景。

文心智能体平台已有许多用户开发的Agent 来源:百度

第二个开发工具AppBuilder,则提前封装和预置了开发AI原生应用所需的各种组件和框架。

最快只需三步,开发者就可以用自然语言开发出一个AI原生应用,能够便捷地发布、集成到各种各样的业务环境中。

百度以“游乐场排队规划助手”的开发实例为例,开发者需要做出一个应用,需要在不同排队时间的项目中规划最佳路线,让游玩的刺激指数最高。

开发者只需做以下几步,不需要输入一行代码就能生成一个应用:

  • 在角色指令中描述具体要求,包括调用代码解释器、算出在固定时间内的最佳组合、输出结果等;
  • 到工具组件中,把代码解释器添加进来,帮助运算;
  • 开始实际应用,用户输入问题“我有3个半小时时间,怎么玩最刺激?”,代码解释器就会将问题翻译成代码,并且对已知的数据(项目排队时间、刺激程度)进行排列分析,最后输出路线。

简单来说,比起去年通过大模型简单生成一些图片、表格,如今有了AI开发工具,用户就能自由选择调用其他的模型,像搭建乐高一样,完成更复杂的任务。

第三款模型定制工具ModelBuilder,主要满足的是专业开发者的需求。许多场景并不需要很大规模的模型,很多时候,小模型通过精调就能实现更好的效果。

作文批改助手模型 来源:百度

百度以作文批改场景为例,首先,作文批改有明确的评分标准,并且不同年级对作文的要求和打分标准,也是不同的。这就需要模型精调,让大模型输出的结果,更符合特定的要求。

因此,通过ModelBuilder,开发者就能先根据自己已经有的作文数据,在平台上完成数据清洗、标注、增强动作,再经过基础模型上的精调,最后部署在平台上,一个专属于作文批改场景的模型就诞生了。

事实上,经过一年发展,百度如今的开发者生态已经颇具规模,截至2024年3月,千帆大模型平台已累计服务用户数超过8万,累计精调1.3万个模型,开发应用数超过16万。

而推出如今的AI开发工具,也是为了“大模型本身并不直接创造价值,基于大模型开发出来的AI应用,才能满足真实的市场需求。”李彦宏说。

开源模型会越来越落后?

除了发布新的开发工具外,当前百度大模型落地的思路已经十分清晰:借助大模型,和百度已有产品线紧密结合。

比如,百度旗下的智能音箱“小度”,就借助大模型变得“更聪明”了。

现在,包括OpenAI在内的头部大模型厂商,在提升大模型能力时,MoE(混合专家模型)已经是较为确定的技术方向,这可以简单理解为在训练和推理时,将不同大小的模型相结合,从而实现更高效的运算。

本次发布会上,百度也发布了全新的AI原生操作系统DuerOS X,将MoE模型应用在了“小度”之上。

现在,向小度’提出包括询问新闻、天气、穿衣推荐、路线推荐等问题,每个问题都会分配给不同模型来执行:比如,调用应用的API接口时,会用ERNIE Functions模型;而询问天气,以及需要当天穿衣建议时,小度就会根据天气查询的结果,调用基于ERNIE Lite打造的精调模型,给用户穿衣建议。

小度的更新逻辑在于,基于已有的文心的模型“裁剪”出适合各种场景的更小尺寸模型,通过精调和post pretrain后,能够更显著降低AI应用的成本。“相比全部使用文心大模型的旗舰版,如今小度的响应速度提升2倍,成本下降了99%。”李彦宏表示。

“大家以前用开源觉得开源便宜,其实在大模型场景下,开源是最贵的。所以,开源模型会越来越落后。”他进一步解释。

这个论断看似激进,但基于一个重要的讨论背景:开源还是闭源,哪个应用成本更高。

开源是互联网的根基,无论是从浏览器的出现,到如今的大模型,都离不开开源的贡献。比如,大模型的核心技术Transformer架构,就是谷歌的开源工作。

到了2023年,Meta旗下的Llama 2开源,免费可商用,这瞬间让大模型领域的格局改变——后来者可以直接基于开源的Llama 2模型基础上做微调,进而开始商业化。

开源能够借助开发者的力量,让技术获得突破,但要降低应用门槛,最终还是要走到用户端:产品落地应用,反哺到开发者生态,才会不断提升已有模型的能力。

正因如此,如今OpenAI等头部模型厂商的最新模型,都毫无疑问走闭源战略,并且大力做商业化。李彦宏的观点代表着,大模型领域经历过去一年紧张的你追我赶之后,如今进入新阶段:商业化效率,将会成为接下来模型能力提升的重要变数。

相关内容

热门资讯

上汽大众成立动力系统新公司 含... 每经AI快讯,天眼查App显示,近日,上海峰梅动力系统有限公司成立,法定代表人为李文辉,注册资本10...
惠民消费券叠加世界美酒!宁夏·... 6月9日-11日,第五届中国(宁夏)国际葡萄酒文化旅游博览会-国际葡萄酒名庄名酒展将在银川国际会展中...
基金分红:华夏合肥高新产园RE... 证券之星消息,5月28日发布《华夏基金管理有限公司关于华夏合肥高新创新产业园封闭式基础设施证券投资基...
凯辉创新基金三期完成10亿美元... 5月28日,凯辉基金正式宣布旗下凯辉创新基金三期圆满完成最终关账,基金管理规模达10亿美元,成为欧盟...
直击蓝晓科技股东大会:董事长高... 界面新闻记者 | 陈慧东 2024年,蓝晓科技(300487.SZ)营业收入25.54亿元,同比增...
总起价近20亿!深圳光明挂牌一... 粤进深 赵盼盼 5月28日,深圳光明区挂牌一宗宅地,宗地号为A509-0074,挂牌起始价19.94...
清华大学互联网产业研究院院长朱... 5月28日,由北京商报社、《中外企业文化》杂志社主办的“2025深蓝媒体智库年度论坛”在北京国际饭店...
原创 A... 昨夜的美股高歌猛进,虽然这与A股的关系不大,但是美股大型科技股的上涨跟我们多少还有些关联吧,比如说看...
原创 深... 文丨詹詹 郭小兴 编辑丨杜海 来源丨新商悟 (本文约为800字) 近期,深蓝汽车可谓连遭舆论风波。...
原创 武... 武清,已经找到了楼市“甜区”。 今年以来,大打改善牌,核心地段的改善洋房掀起一股热潮。 城投春上...
重磅活动!王涵:长期视角下的经... 上证·首席讲坛”由上海证券报和中国首席经济学家论坛共同打造,致力于搭建高端交流平台,邀请业内顶级专家...
银行行业28日主力净流出6.1... 5月28日,银行行业上涨0.28%,今日主力资金流出6.1亿元,成分股21只上涨,17只下跌。 主力...
深铁5个月四次“输血”万科近1... 金融界5月28日消息 在万科深陷债务的关键节点,已经从万科退休多年的大佬王石罕见发声,正在尝试与万科...
原创 A... 今日的A股,成交量又只有万亿成交量了,比昨日更离谱的是沪深300成交量只有1600亿,TMT赛道的成...
医疗大模型浪潮:讯飞医疗领航,... 在医疗人工智能领域,大模型的发展正迎来政策与市场的双重机遇。近日,动脉智库发布了《2025医疗大模型...
食品饮料-零食行业:鸣鸣很忙(... 今天分享的是:食品饮料-零食行业:鸣鸣很忙(02143),招股说明书梳理,零食量贩龙头,引领万亿元赛...
收评:沪指震荡跌0.18%,医... 27日,两市主要股指盘中弱势下探,深证成指、创业板指一度跌约1%,全A成交额再度萎缩。 截至收盘,沪...
刚刚,备案!万亿巨头出手 【导读】泰康稳行完成私募基金管理人备案登记,泰康人寿首期投资规模预计为120亿元 中国基金报记者 吴...
助小微企业走出融资困境 小微企业创新迭代快捷、市场反应敏锐、细分领域广泛,在推动科技创新、吸纳人员就业、丰富文化业态等方面发...
越跌越买!红利又被抢疯了 上周三$中证红利ETF(SH515080)$创了阶段新高后有些回调,一下子又被买疯了,这周一和这周二...
李彦宏念念不忘,百度电商重启在... 文/华尔街科技眼 Leon 临近6.18大促,各大平台、商家都开始了预热。网红罗永浩于5月23日...
特朗普:若加拿大成为美国第51... 当地时间5月27日,美国总统特朗普在其社交媒体平台“真实社交”上发文表示,加拿大非常希望成为美国“金...
煤炭板块午后逆势上行,国企红利... 5月28日,三大股指午后小幅走低,而国企红利板块逆势上涨。截至下午13:30,国企红利ETF(159...
比亚迪回应山东经销商“资金链断... 针对近期“比亚迪山东经销商济南乾城汽车贸易有限公司‘资金链断裂’”传闻,比亚迪集团品牌及公关处相关人...
精致时代下,国际品牌如何赢得中... 汇聚行业论坛洞察,解读前沿报告观点,提炼关键趋势,为您呈现深度思考与精准研判。 作者|Huiyan ...
重磅!牧原递交港股IPO申请,... .................. 5月27日,牧原股份向香港联交所提交上市申请。牧原股份提到,按...
东南亚消费者为何愿为猫人买单?... 在国货出海浪潮奔涌的当下,越来越多中国品牌怀揣着“品牌全球化”的野心踏浪而行。 当多数玩家困守低价红...
又一场暴风雨来临?日本长债拍卖... 周三,投资者屏息以待日本40年期国债拍卖,因该国收益率波动持续冲击全球债券市场,全球借贷成本上周遭遇...
确认了!她接棒父亲任董事长 近日,利群商业集团股份有限公司(以下简称“利群股份”)发布公告称,现年42岁的徐瑞泽接棒父亲徐恭藻,...