亚马逊云科技王晓野:针对业务场景更换大模型,而不是一个模型试验不同场景 | 2024 ITValue Summit数字价值年会
创始人
2024-09-14 13:57:47

9月11日-14日,由钛媒体与ITValue共同主办的2024 ITValue Summit 数字价值年会在三亚举行。此次峰会主题为“Ready For AI”,交流经验教训,交叉行业思考,推动创新交易,以创新场景为基础,共同探索AI驱动下数字经济时代的全新机遇,共同打造一场数字经济时代的AI创新探索盛宴。

大会上,亚马逊云科技大中华区产品部技术专家团队总监王晓野发表了“GenAI驱动场景创新,释放业务价值”的主题演讲。

此外,数据基础非常重要,王晓野提到,大模型系统先天就具有幻觉现象,无论是模型也好,还是与模型一起构建的系统也好,从数据的视角看,系统永远是“垃圾入垃圾出”,或许让企业真正发挥业务价值的答案,就在数据里。

最后他表示,企业在选择大模型合作伙伴时,需要有两个方面的能力,一方面是基础技术能力,云厂商从整个算力到数据能力,以及人员支持上能与企业共创。

“从云厂商的视角看,此时此刻是技术变革的转折点,这是前所未有的重塑业务的最佳时机。“他说。

以下为王晓野演讲内容,经钛媒体整理:

近些年来云计算爆发,越来越多的企业拥抱云计算,推动了从数据到算力,乃至于云计算整体的发展。过去的模型被生成式模型逐渐替代,它在很多的场景下比小模型有更好的表现。

2024年IDC预测全球40%的企业会在AI上投资,到了2025年是68.6%。现在各位有没有这样的感觉,AI是不是到了像之前的元宇宙一样,走到向下行或者这一波浪潮结束的阶段。

给出答案之前,先来看看我们的合作伙伴法拉利。法拉利在使用AI技术定制化汽车的颜色,以及赋能几千名维修人员,同时生成式AI也广泛加速汽车模拟场景的AI应用。

回到刚才提的问题,如果说2023年大家处于FOMO(Fear of Missing Out)的状态,追着我们问,什么是大模型,大模型能做什么,我们能在什么场景用。到了2024年,客户跟我们谈得最多的是实际的问题,这个模型后还能不能再便宜一点,能不能用其他的模型替换。这一年AI话题虽然被讨论了很多,但还只是一个开始,相信下一个时代,由于技术的改变,各行各业会更积极地拥抱AI。

我们很早以前就推荐给广大企业,拥抱生成式AI的路径。即从业务场景开始,再准备数据,必经的过程是企业对自己的数据进行定制,最重要的是后面的工程化和应用集成,并服务到业务中。这个过程不是一蹴而就,需要持续地迭代。直到今天这个过程完全没有变。

大模型的关键,在于匹配场景

我想强调的一件事情,还是从场景出发,企业自身的场景,而且反复迭代。今天所有的大模型,我们都认为它是三头六臂,但一定要从企业最想要的功能出发去选择,这个三头六臂有的练的是铁头功,另一个练的是麒麟臂,一定要匹配您最需要的模型。

以亚马逊云科技自身来讲,我们自身应用AI的场景是不一样的,我们推出了生成式AI快速总结客户评价;如果想给一个小姑娘买圣诞礼物,我们推出专业的AI购物助手;在药房的场景下,可以从非结构化的处方信息快速提取用药信息,帮助药房捡药,告诉病人如何使用药品。每个场景背后都不是相同的模型。

虽然有些场景看似眼熟,但细分关注的信息和需要的能力不一样。比如翻译,文章翻译和实时翻译,推理的速度要求不一样,在时效性要求高的场景下,企业要关注的是模型是否能以比较低的成本高速响应需求,满足场景。

在智能运营场景,对于用户声音、客户评论情感的分析,以及对应词条背后逻辑关联的梳理。SHULEX致力于赋能品牌出海,对于用户的流程有10%以上的效果提升。

在品牌宣传营销场景,我们看重的是模型的个性化、丰富程度。例如赛狐ERP,利用大模型生成文案,同时可以控制生成关键词,不仅实现文案生成效率的提升,还植入亚马逊云科技检索的关键词。

对于风控场景,我们看到的是模型对于内容的理解,以及对于审核标准的执行,今天多模态的模型,除了文字、语言,还有类似游戏聊天窗口发的图像。连续多模态语意的理解,这是过去模型做得不太好的地方,目前沐瞳科技实现了90%以上的辱骂识别率。

Ready for AI,数据先行

在模型之外,数据的重要性不言而喻。

无论是模型也好,还是跟模型一起构建的系统也好,从数据的视角看,这个系统来说永远是“垃圾入垃圾出”,无论是训练模型还是通过知识库,喂给系统什么样的数据出来就是什么样的效果。

今天生成式模型原理上存在幻觉,或许让企业真正发挥业务价值的答案,就在数据里。

从Data for AI看,企业额外投入的是这几个层面:第一,迭代模型视角,有没有足够的能力为模型准备优秀的数据,有没有建立数据的闭环;第二,在整个模型应用的过程中,数据如何高效提供给业务,比如知识库可以检索公开数据,调用海量的知识。假设今天搜索场景高并发的情况下,能不能提供在线服务和线下海量交互生成的数据循环回来,为模型服务的数据能力是否具备。这些场景都是企业需要投入和思考的。

如何应用数据定制企业自身的独立特点?我们可以做PE(Prompt Engineering),可以做RAG,可以微调。很多人走了认知上的弯路,这不是我们技能上出了问题,是整个行业都在摸索、共创、探索。

刚才提到数据服务AI,如果没有做好元数据管理,企业有什么数据不知道怎么用,那就是一个挑战,也可以说是新的机会。过去我们只能基于表格或者数据库整理数据,通过人工梳理的元数据,今天有非常多的数据用到模型的能力,重新定义元数据管理。

举个例子,在汽车自动驾驶领域,驾驶数据实际上只有1%真正可以用来做模型训练,或者是对模型训练的结果有用。多模态对场景的理解是非常好的机会。全球已经有非常多的数据厂商都走向这个方向,包括做数据集成,他们已经推出生成式管理。Data for AI这件事在数据管理上又是一个新的机会。

回到数据能力,数据能力好意味着什么?有几个例子,第一个是WPS,基于过去PPT生成模板,在短短的几个月内帮他们实现两个场景,一个是文本的润色翻译,二是PPT自动生成,大模型完成大纲生成和详细描述,背后的模板生成都是常年积累下来的数据。

当企业构建一个应用时,我建议大家加强数据技术的能力,同时要关注选择什么样的项目。不知道如何立项时,从自己的客户,无论是内部、外部,还有自己的场景出发,背后还有非常重要的一些事情,人员的技能。

对于生成式AI,要求的技能完全不一样,包括工程化的技能、生成式的图片,如何管理隐私数据的保护,这些事情过去都是要做的,只是生成式AI的要求更高,对企业需要投入的资金,以及能力、精力提出了前所未有的标准。

快速总结成功企业的经验,一是要针对业务场景了解模型的能力,而不是本着不变的模型不断地试不同的场景。第二是数据的基础非常重要,第三,如果说选择合作伙伴,需要有两个方面的能力,一方面是基础技术能力,云厂商从整个算力到数据能力,以及人员支持上与企业共创。同时,我相信我们的企业在未来的投入的比例上,数据、人才和背后整个公司对于AI数量的投入占到未来企业精力50%以上。

从云厂商的视角看,此时此刻是技术变革的转折点,这是前所未有的重塑业务的最佳时机。借用法拉力的话结束今天的演讲,最伟大的法拉利永远是没有设计出来、制造出来的下一款。

以上是我的分享,谢谢!

相关内容

热门资讯

【财经早晚报】字节将禁用第三方... 今天值得关注的国内外新闻有: 1. 外交部:中国对沙特、阿曼、科威特、巴林4国试行免签 2. 工信部...
GTCFX:多元化产品组合满足... 摘要: 探索GTCFX多元化产品组合,满足您的交易需求,实现投资目标的最佳选择。立即点击了解更多,开...
上汽大众成立动力系统新公司 含... 每经AI快讯,天眼查App显示,近日,上海峰梅动力系统有限公司成立,法定代表人为李文辉,注册资本10...
惠民消费券叠加世界美酒!宁夏·... 6月9日-11日,第五届中国(宁夏)国际葡萄酒文化旅游博览会-国际葡萄酒名庄名酒展将在银川国际会展中...
基金分红:华夏合肥高新产园RE... 证券之星消息,5月28日发布《华夏基金管理有限公司关于华夏合肥高新创新产业园封闭式基础设施证券投资基...
凯辉创新基金三期完成10亿美元... 5月28日,凯辉基金正式宣布旗下凯辉创新基金三期圆满完成最终关账,基金管理规模达10亿美元,成为欧盟...
直击蓝晓科技股东大会:董事长高... 界面新闻记者 | 陈慧东 2024年,蓝晓科技(300487.SZ)营业收入25.54亿元,同比增...
总起价近20亿!深圳光明挂牌一... 粤进深 赵盼盼 5月28日,深圳光明区挂牌一宗宅地,宗地号为A509-0074,挂牌起始价19.94...
清华大学互联网产业研究院院长朱... 5月28日,由北京商报社、《中外企业文化》杂志社主办的“2025深蓝媒体智库年度论坛”在北京国际饭店...
原创 A... 昨夜的美股高歌猛进,虽然这与A股的关系不大,但是美股大型科技股的上涨跟我们多少还有些关联吧,比如说看...
原创 深... 文丨詹詹 郭小兴 编辑丨杜海 来源丨新商悟 (本文约为800字) 近期,深蓝汽车可谓连遭舆论风波。...
原创 武... 武清,已经找到了楼市“甜区”。 今年以来,大打改善牌,核心地段的改善洋房掀起一股热潮。 城投春上...
重磅活动!王涵:长期视角下的经... 上证·首席讲坛”由上海证券报和中国首席经济学家论坛共同打造,致力于搭建高端交流平台,邀请业内顶级专家...
银行行业28日主力净流出6.1... 5月28日,银行行业上涨0.28%,今日主力资金流出6.1亿元,成分股21只上涨,17只下跌。 主力...
深铁5个月四次“输血”万科近1... 金融界5月28日消息 在万科深陷债务的关键节点,已经从万科退休多年的大佬王石罕见发声,正在尝试与万科...
原创 A... 今日的A股,成交量又只有万亿成交量了,比昨日更离谱的是沪深300成交量只有1600亿,TMT赛道的成...
医疗大模型浪潮:讯飞医疗领航,... 在医疗人工智能领域,大模型的发展正迎来政策与市场的双重机遇。近日,动脉智库发布了《2025医疗大模型...
食品饮料-零食行业:鸣鸣很忙(... 今天分享的是:食品饮料-零食行业:鸣鸣很忙(02143),招股说明书梳理,零食量贩龙头,引领万亿元赛...
收评:沪指震荡跌0.18%,医... 27日,两市主要股指盘中弱势下探,深证成指、创业板指一度跌约1%,全A成交额再度萎缩。 截至收盘,沪...
刚刚,备案!万亿巨头出手 【导读】泰康稳行完成私募基金管理人备案登记,泰康人寿首期投资规模预计为120亿元 中国基金报记者 吴...
助小微企业走出融资困境 小微企业创新迭代快捷、市场反应敏锐、细分领域广泛,在推动科技创新、吸纳人员就业、丰富文化业态等方面发...
越跌越买!红利又被抢疯了 上周三$中证红利ETF(SH515080)$创了阶段新高后有些回调,一下子又被买疯了,这周一和这周二...
李彦宏念念不忘,百度电商重启在... 文/华尔街科技眼 Leon 临近6.18大促,各大平台、商家都开始了预热。网红罗永浩于5月23日...
特朗普:若加拿大成为美国第51... 当地时间5月27日,美国总统特朗普在其社交媒体平台“真实社交”上发文表示,加拿大非常希望成为美国“金...
煤炭板块午后逆势上行,国企红利... 5月28日,三大股指午后小幅走低,而国企红利板块逆势上涨。截至下午13:30,国企红利ETF(159...
比亚迪回应山东经销商“资金链断... 针对近期“比亚迪山东经销商济南乾城汽车贸易有限公司‘资金链断裂’”传闻,比亚迪集团品牌及公关处相关人...
精致时代下,国际品牌如何赢得中... 汇聚行业论坛洞察,解读前沿报告观点,提炼关键趋势,为您呈现深度思考与精准研判。 作者|Huiyan ...
重磅!牧原递交港股IPO申请,... .................. 5月27日,牧原股份向香港联交所提交上市申请。牧原股份提到,按...
东南亚消费者为何愿为猫人买单?... 在国货出海浪潮奔涌的当下,越来越多中国品牌怀揣着“品牌全球化”的野心踏浪而行。 当多数玩家困守低价红...