
百度沈抖:智能基础设施,为应用而生
大模型开发/产品动态
- 文心大模型
4月30日3843看过
视频内容可前往原文观看
4月25日,Create2025百度AI开发者大会在武汉体育中心举行。会上,百度集团执行副总裁、百度智能云事业群总裁沈抖分享了百度智能云在智能基础设施建设上的最新成果。
过去一年,大模型加速深入产业,越来越多企业将其应用于核心业务场景。在多数情况下,企业使用大模型,已经远不止简单的API调用。事实上,一个应用的落地,本质上是一个系统性的构建过程——不仅需要强大的算力支撑和灵活的模型平台,还需与企业自身系统深度融合,同时保障计算性能、稳定性、扩展性与安全性,支撑业务的持续发展。
为加速这一进程,百度智能云围绕算力、模型、数据、应用,打造系统级的智能基础设施。这是一套开放的系统。企业可以加上自己的数据、流程、业务逻辑,把这套能力转化为企业专属的AI基础设施。
沈抖表示,系统的价值,不仅是解决某一个问题,而是让企业拥有创造“创造的能力”,这种能力会成为整个AI生态发展的源动力。

以下为演讲全文:

尊敬的各位嘉宾、各位开发者,线上线下的各位朋友,大家中午好!

今天咱们相聚武汉,那就先从武汉的一个特产:莲藕,聊起。我们都吃过藕,但挖过藕的人不多。挖的时候,得先判断它的大致方向,然后一点点顺着它的走势清泥、开路,不能快,不能猛。
要把一根藕完整的挖出来,靠的是经验、是技艺,还有那股躬身入局的劲头儿。站在岸上的人,是看不到藕的。只有真正踩到淤泥里,才能把事儿干成。咱们做AI、做大模型,也是一样。只有深入产业,才能挖出真正的价值。

今天,大模型的应用,绝大多数情况下,不是简单的调用一下大模型。而是需要对接各种组件、工具,需要做各种精细的编排。很多时候,为了进一步提升效果,还需要对模型做调整,定制专精模型。特别是搭建企业级业务,还得考虑计算性能、稳定性、扩展性、安全性……所以,一个应用的落地,本质上是一个“系统”的构建过程。这个过程不容易,也没法省略。
但这个过程显然可以被加速、被简化。

百度智能云一直在做的,就是打造一套智能基础设施,最大限度地降低客户、伙伴的试错成本,让创新更容易。
去年,我们发布了全球首个智能计算操作系统:万源。
经过一年的产品打磨,从算力、到模型、应用的每一层,我们都做了升级!

先看算力。
对云厂商来说,算力不是一个抽象的概念,它是一张张真实的卡在运行。刚才Robin点亮了昆仑芯P800的三万卡集群,我和大家一样激动。过去十几年,中国的半导体产业真的很难,但也很争气!国产算力这几年,取得了一系列的突破。很荣幸,百度也是其中的一份子。
今天,我给大家认真汇报一下昆仑芯P800的进展。
P800是一款真正意义上为大模型设计的芯片,它采用了完全由昆仑芯自研的XPU-P架构,显存远超同类产品;而且计算性能强劲,32台就可支持DeepSeek满血版全参训练。CUDA上能跑的国内外大模型,在P800上都可以跑,迁移成本非常低。
当然,所有的技术突破,最终都要落到客户价值上。其中,金融行业对算力的国产化要求非常高,不仅要系统稳定、性能强、成本可控,还要保障供应链安全,满足合规审查等等。

作为金融科技创新的标杆,招商银行始终走在探索的最前沿。我们携手招行,基于昆仑芯P800展开算力合作,稳定支持了行里所需的各类大模型,性能表现卓越,帮助招行快速提升了智能客服、多模态数据分析等场景的应用效能。
除了招商银行,像国家电网、中国钢研等越来越多的央国企,以及同济大学、北京大学等高校和一批互联网企业,也都开始规模化地部署昆仑芯P800算力。
今天,很高兴地告诉大家,昆仑芯又有新进展!
我们正式发布:昆仑芯超节点!
我们把64张昆仑芯AI加速卡放到同一个机柜,实现单节点的超强性能!
同样是64张卡,过去需要放在8台机器里;现在我们可以把这些卡放在同一个机柜里,用更快的机内通信替代机间通信,降低机柜之间通信的复杂性,进而降低延迟和带宽成本。
在昆仑芯超节点上,卡间互联带宽提升到原来的8倍!
单机训练性能提升了10倍,单卡推理性能提升了13倍!从性能上讲,一个机柜就能顶过去上百台机器。
而且,昆仑芯超节点的扩展能力极强,目前已经具备了万卡、三万卡,甚至十万卡集群的交付能力。
强大的芯片只是起点。要稳定、极致地发挥出芯片的价值,还需要平台的支撑。

百度百舸就是这样一个稳定、极速、高效的算力管理平台,能极致满足企业的训练、精调、推理的全流程需求。百舸不仅管理着百度自用的GPU算力,支持着文心大模型训练和推理、百度搜索、网盘、地图等所有百度业务,同时还纳管了几十万张卡,服务着各行各业的客户。
今天,随着DeepSeek R1、文心X1等深度思考模型的普及,客户对模型推理成本和延迟的要求越来越高。我们知道,训练成本很关键,但这只是少数企业关心的事,而推理成本则是每一个用大模型的人都关心的事。

所以,除了支持好训练,百舸在持续推动推理加速的极致优化。这套能力正在支撑千帆平台,为40万客户提供服务。上线以来,千帆的推理吞吐提升了20倍,推理速度提升了50%以上。
千帆很多客户,最近应该已经感受到模型响应速度更快了。这背后是两个关键能力:
第一,大规模PD分离式推理。百舸支持客户根据不同场景的业务特点,自适应地设置P和D的配比;还能够把资源拆到更细一层,做到token级别的PD负载均衡。
第二,对于需要大规模调用DeepSeek这种MoE模型的客户来说,百舸做到了大规模多机专家并行的极致优化,能帮助客户根据线上流量特点进行自适应的专家编排,大幅降低这类模型推理的通信开销。
而且我们还对核心链路上的每一个细节做了系统级的工程优化:从算子融合、all-to-all 通信算子优化,到异步KV传输、双流编排……力争把每一块显存、每一个Core都用到极致。

这就是百舸,迄今为止百度最强大的GPU算力平台!
它不仅支持着像招商银行、中国石化、长安汽车等有超大规模算力需求的企业,也很好地支撑着各类创企客户和伙伴的模型训练和推理需求。
接下来,有请我们的客户,北京人形机器人创新中心CEO 熊友军博士,为大家分享。

感谢抖总。我是北京人形机器人创新中心的熊友军。很高兴今天在百度Create大会的平台,与大家分享创新中心在具身智能领域的最新探索和实践。先和大家分享一个令人振奋的消息。上个周末,我们团队研发的“天工”机器人,在北京亦庄半马比赛中,以2时40分42秒的成绩成功完赛,创造了历史,成为全球首个完赛半马的机器人跑者。对于具身智能行业来说,马拉松不只是简单的体育竞技,更是对技术突破、产业发展的一次“极限测试”,验证人形机器人能不能连续自主、稳定地执行任务。未来,机器人还将迎来更多这样的“里程碑”时刻!路途虽远,好在从不缺少同路人。百度智能云为创新中心提供了领先的产品和专业的服务,为具身智能的持续进化按下“加速键”。北京人形机器人创新中心具备具身智能软硬件全栈技术积累,正在围绕通用机器人平台“天工”、通用具身智能平台“慧思开物”,打造具有全球影响力的具身智能创新策源地,以及具身智能应用示范高地。先来看看通用机器人母平台“天工”。左侧的“天工2.0”是全尺寸的通用人形机器人,率先实现了国内首个针对复杂地形的自适应行走;右侧的“天轶2.0”是轮臂机器人,拥有轮式全向移动能力,在平地的作业环境中,移动更高效。二者均具备更强的人机交互、智能化水平,工业级上肢负载能力,更大的双臂末端稳态负重,动态作业精度达到毫米级。今年3月,我们发布了全球首个“一脑多能”“一脑多机”的通用具身智能平台“慧思开物”,颠覆单一场景、单一任务做专项开发这一传统机器人应用开发模式,实现多本体兼容、多场景适应,具备强大的泛化能力。它由两部分组成,包括由AI大模型驱动的具身“大脑”,以及由数据驱动的具身“小脑”。“大脑”负责任务规划,通过调用“小脑”技能库执行具体动作,并将执行反馈传递回“大脑”,形成任务闭环。在“慧思开物”平台日常研发过程中,百度为我们提供了高性能、稳定可靠的AI基础设施,百度百舸在算力高效调度、模型训推加速等方面的产品技术积累,大幅提升了具身模型开发效率。在具身“大脑”能力构建上,通过使用千帆大模型平台,和以文心大模型4.5为代表的领先模型能力,可实现自然语言指令的精准解析,并通过多模态信息融合与上下文理解,将复杂任务分解为可执行的子任务序列,提升决策效率和准确性。未来,“慧思开物”平台也将实现N个场景适配,多构型机器人的适配,大幅减少开发时间,目前已在工业分拣、积木搭建、桌面整理、物流打包等场景进行应用。基于“慧思开物”平台,天工已实现最高12公里/小时的奔跑。并可基于视觉感知移动,连续攀登百级台阶。通过雪地、草地、沙地等多种复杂地形。包括在高冲量干扰情况下,保持机器稳定运行。长期、稳定的运动能力是人形机器人走进人类生活自主作业的关键技术基座,为人形机器人走进户外救援、进入不同非标场景奠定基础。机器人要想真正成为人类生产生活中的帮手,还需要高成功率、高泛化性、高灵巧性的具身操作能力,这是产业界、学术界技术攻关的重点方向。基于“慧思开物”平台,机器人可实现自动错误处理,遇到失败或者意外情况,能够自动重新规划、执行,保证任务成功完成。可实现精准任务规划,基于文心大模型4.5等多模态大模型,针对感知结果,实现复杂任务精准规划,展现了具身智能在教育娱乐、精密制造等领域的应用潜力。实现精准识别与多技能操作,针对长程任务,完成精确的环境感知、物体识别和多技能调用。可以看到,在真实物流打包场景中,机器人从物品处理到包装封箱的全流程自动化操作。实现双臂协同,基于VLA模型实现双臂协同操作,完成开袋子、开柜子、打扫等灵巧操作。不同于训练大语言模型时,已经拥有海量的互联网文本图像数据,高质量的具身智能数据,特别是跨模态融合的数据集,目前还非常稀缺。面对行业共性挑战,创新中心正在建设具身智能数据生产、采集、标注和存储一体化的国家级数据采集训练场,打造全球范围内规模最大、信息最稠密、最通用的具身智能数据集。百度在自动驾驶等行业沉淀了规模化、专业化的AI数据采集和标注服务能力,在百度智能云数据服务团队的助力下,加速建设百万量级的高质量具身数据集。目前,创新中心已完成了全链路具身数据闭环的突破,建立起多场景、多类型的数采基地,实现多本体、多任务数据采集,建设了全国首个具身智能机器人数据平台,并牵头制定具身智能行业相关标准。同时,我们也在构建开源开放社区,围绕本体、数据、运动、工具链等方面,有序开源,推动整个行业生态繁荣发展。在接下来的几年,不同形态的具身智能机器人将走入大家的生产生活,有望成为继个人计算机、智能手机、智能汽车后的下一代人机交互中心。我们这一代人,将有幸见证那些很早就存在于影视作品中的“人机共生”画面成为现实。北京创新中心将继续携手百度智能云,共同加速这一天的到来!谢谢大家!

谢谢熊总!也祝贺天工取得机器人马拉松冠军。
我们刚才讲算力,算力之上是模型,模型效果决定了应用的体验。在这一层,模型的调用、模型的开发,是最重要的两件事。

现在在千帆平台上,已经提供了100多个模型,既包括刚才我们发布的4.5 Turbo和X1 Turbo等一系列百度自研的文心模型,也包括像DeepSeek等第三方模型。

总之,过去这些客户用得上、效果好的模型在千帆上都能找得到。而且服务稳定可靠。同时,现在行业里也逐渐形成共识,那就是在大模型落地的过程中,企业对于定制专精模型的需求在持续增加。
之前我给大家分享过很多次,千帆平台上有完整的工具链供大家开发模型。

现在我给大家讲一个模型蒸馏的案例,我们的客户智联招聘,一直在积极拥抱大模型,在探索业务创新。在人岗匹配的场景上,他们先用了行业里比较领先的深度思考模型,上线以后确实得到了广泛的好评,但是用户规模起来以后,高并发的要求使得成本、延迟都成了新的难题。基于千帆的工具链,他们使用千亿参数的DeepSeek R1作为“教师模型”,用百亿参数规模的ERNIE Speed作为“学生模型”,通过对“教师模型”蒸馏得到的数据集,然后对“学生模型”进行调优。调优后,只需付出“学生模型”的成本,就能享用到“教师模型”的效果。
换句话说,在效果不变的情况下,成本大大降低,只有原来的三分之一。

当然了,要想发挥好模型的价值,做完精调还不够,还需要做应用开发,在千帆上我们为大家准备了低代码和高代码两套应用开发的工具链,供不同喜好的开发者来使用。

2023年9月份,我们发布Agent框架,去年9月份升级企业级Agent,现在看来Agent仍然是应用落地最好的架构。
特别是今年,DeepSeek R1和文心X1这样的深度思考模型出现,让Agent解决复杂问题的能力有了指数级提升。

但是我们今天讲到Agent的时候,可能大家经常想到的是比较流行的框架或工具,比如manus。但实际上还有很多企业找到我们,他们要定制自己的智能体。为啥呢,因为他们要把智能体真的用到他的企业里还有几个关键的问题必须解决。
第一个,他得结合企业的私域数据、企业的知识库,得让Agent能学习到这些企业多年来沉淀的行业经验,理解他们的业务场景。
第二个,很多企业有自己标准的SOP,不能让大模型自己发挥,他们得根据企业规范编排业务流程、执行任务。
第三个,他得调用很多工具,不是现在简单的内置几个工具。
最后,也是非常重要的,真正要在企业里用起来,得满足企业级服务所需要的安全性、稳定性和可控性。
整个东西做下来,不是简单的用一个智能体就行了,又是一大堆工程。所以在千帆上我们准备了一系列工具,这些问题都可以迎刃而解,可以帮助我们企业定制他们自己专属的Agent。

举个例子,我们有一个客户污水宝,是做污水处理项目的信息聚合平台,连接这些招标单位和工程单位,但是这些项目一般都是中小型项目,区域性非常强,所以对这些工程团队来讲,他们很难准确找到招标信息。污水宝就想做一个Agent,为这些工程单位生成专业的报告,提供有价值的行业分析。这时候,通用Agent就很难了,关键是它拿不到污水宝手上的上百万的文档,它只能用联网的数据;另外,它的工具调用能力不强,所以我们希望基于千帆来给客户定制一个专属的Agent,看看它怎么做。
首先进入千帆,选择智能体pro,它默认会带一些智能工具,我们输入角色指令,关联企业知识库。直接看一下效果,它要给一个公司生成一个专业的报告,对这个公司未来的资金投入、研发投入、投标策略给出建议,并且要结合企业自身的知识库和网上的公开信息。
我们点击“发送”,让智能体执行需求,它会把整个任务拆解成很多细分任务,在企业知识库里反复查找、对话,找到合适的信息。同时它也会到网上搜集尽可能多的数据,把它放在一起,这不是一次简单的查询就结束了,而是要根据收回的结果不断地迭代、优化,最终生成完整的报告。
报告生成以后,我们可以把它下载下来,进一步地浏览。我们可以看到,报告本身的结构很清晰,内容很丰富,而且其中一些关键的结论,参考的是企业自有的信息和是网上的信息。这里更关键的是它会把企业自有数据库里的这些信息整合起来,采纳下来,而这个是公网的信息实现不了的。
我们刚才重点讲了Agent,它想用自有知识库的时候,我们需要给它定制,但实际上这些Agent还需要大量的数据和工具,如果在企业场景里真的要把它用起来,实际上要比刚才的demo复杂很多。

好在过去三十年,互联网,尤其是移动互联网高速发展,整个行业数字化转型非常深入,所以已经沉淀了大量的数据和工具,我们怎么能让刚才这些Agent很方便地把这些数据和工具都用起来。刚才Robin讲到的MCP,它的出现让我们找到了解决方案。
百度要做的就是拥抱这样的标准协议,打造一个开放的平台,把这个需求和能力连接起来。

上个月百度已经在国内率先地实现了MCP协议的全生态兼容,今天我们正式推出千帆企业级MCP服务,第一批已经有1000多个MCP Servers接入了这个平台,而且还在持续地扩展中。
这时候大家在创建一个Agent的时候,就可以把这些能力,灵活地接入到自己的应用里面去,就像刚才Robin演示的,通过借助AI搜索和百度优选这样的MCP Servers,简单几步,智能体就具备了智能购物的能力,这时候您还可以按需往里面不断地加能力,可以随心所欲地打造您自己需要的多面手。
更重要的是,除了用这些已有的MCP Servers,开发者还可以在千帆平台上很方便地开发自己的MCP Servers,一键就可以发布到MCP广场上,百度搜索就会快速地索引这些Servers,让更多的开发者可以找到它们,同时也可以把它们很好地用起来。
所以我们特别希望在座的诸位,以及线上线下的朋友们,我们多多地去拥抱MCP,去开发MCP Servers,把自己的能力释放出来,把这个生态做大,同时也给自己带来更大的商业价值。

我刚才讲了千帆的模型微调能力、应用开发能力,我们很多客户已经基于千帆做了很多行业创新,接下来我们再请下一位嘉宾,民生银行的首席信息官张斌先生,来给我们分享一下他们的实践经验。

今天我给大家分享两方面的内容,一是作为一家股份制商业银行,民生银行在大模型的建设和应用方面做了哪些工作,二是我们在工作中形成的一些认识和对未来的思考。应该说,以大模型为代表的生成式人工智能取得的突破,使得AI在技术能力、应用范围、对社会的影响上,相比过去都发生了质的飞跃。正是在这样的背景下,结合我们对AI未来发展的判断,民生银行在2023年的四季度明确了将推动AI技术在银行全面应用作为一项战略举措,并作为一把手工程来组织推动,制定了积极稳妥、先内后外、全面推进、重点突破的总体策略。具体工作主要包括两个部分,一是体系化的能力建设,二是基于能力的应用场景落地。随着工作的推进,我们在模型选择、技术应用和应用模式等方面,也形成了自己一些认识和做法。模型选择方面,民生银行的定位是不做0到1的预训练,不开发基础大模型,我们使用开源或商业大模型。一种是直接使用,另一种是为了提高效果或推理能力,对基础大模型进行微调,包括使用蒸馏技术后使用。我们也结合大模型、提示词、知识库、工作流等不同的技术组合,形成了四种应用开发范式来解决不同应用场景的问题。结合过去将近两年的工作,民生银行初步建成了由算力、模型、数据和平台构成的大模型技术支撑体系。在这个支撑体系下,我们落地了40多个应用,覆盖140多个细分场景。在大模型体系建设工作中,民生银行和百度一直有非常密切的合作。百度赋能了我们的能力建设和具体场景的落地,帮助我们加快场景的应用探索。比如,民生银行在去年引进了百度智能云的千帆大模型平台,和我们过去在用的百度智能云机器学习平台一起,构成了大小模型一体化的AI研发平台。我们也借助百度的知识检索核心组件,构建了由四个引擎组成的知识检索平台,支持三类应用模式,现在全行已经有1.6万人在使用,使得全行员工在知识获取便捷性和满意度层面有了非常大的提高。另外,今天会议的主题是开发者大会,民生银行加上合作伙伴的开发者有5000人左右,AI4SE也是我们非常关注的一个领域。去年开始,我们基于百度文心快码与工程平台,推进代码续写、单元测试、代码优化等辅助功能应用,在开发效率和开发质量上都取得了不错的提升。同时,我们现在也在把大模型的能力和企业内部的知识、架构、规范、业务做结合,希望大模型未来在这几个领域能够发挥更大的作用。经过两年的实践,我们有了如下认识:第一,对于一个银行这样的企业,如果要把大模型落地并发挥价值,微调训练是必不可少的。有一些场景如果不做微调训练,基本上没有办法使用;做了微调训练,效果就会有大幅的提高。第二,在某种程度上,知识体系的完整性、有效性,决定了大模型能够发挥价值的上限。在民生银行,大模型应用和知识管理体系的建设是两个平行推动的项目,都是一把手工程,正是因为这两个工作同步推动,才收到了比较好的效果。第三,推理类大模型在一些逻辑性很强的领域,例如分析、代码编写,非常有必要。对于推理类的模型,我们要处理好它的幻觉问题,不管从训练、推理到应用各个环节都可以采取一些有效的措施。有人说2025年是AI Agent元年,AI应用的广度和深度在这一年迎来了爆发阶段。结合过去的实践和这一段时间的思考,我们觉得要把AI用好,下一个阶段,银行要做好由数字化向智能化的跨越,以下四个环节非常重要:第一是人才,算法、数据科学、解决方案工程师等人才很重要,对全员进行AI认知和应用能力的相关培训也非常重要。这是我们在逐步深入、扩大AI使用范围的过程中,一个很深切的体会。第二,AI驱动是技术驱动,银行也要把握技术趋势。银行要依靠产业和行业的力量,来构建自己的技术体系和能力,当然,我们会把更多的精力放在应用场景价值上。第三,架构是我们要面临的一个问题,因为AI带来的是一个技术应用范式的变化。当我们从数据驱动到知识驱动、从云原生到AI原生,一定要找到一条通往未来的路径和方法。第四就是AI的治理。与生成式AI相关的安全、风险乃至伦理问题,一直广受关注。金融行业积极拥抱大模型的同时,必须关注AI的风险管理,包括提升可靠性、透明性,建立清晰的责任机制,以及必要的人工介入程序等。最后,在积极拥抱大模型的过程中,希望我们行业和产业共同努力,从数字化迈向智能化,走得更快、更稳。谢谢大家!
谢谢张总的分享,刚才讲了模型、算力、应用,再加上数据管理和数据处理,这就是一整套的智能基础设施。我们用这套能力在赋能客户的同时,我们自己也在通过两款产品不断地打磨和验证这套能力。

第一个要给大家介绍的是智能客服产品客悦,半年前我给大家展示了它在车险续保场景的效果,现在已经在多个场景地落地见效。今天正式发布一个全新的、集营销与服务于一体的产品客悦·ONE,能够提供全生命周期的营销服务。在获客阶段,它可以做到目标受众的精准触达;在转化阶段,它得成为一个高情商的金牌销售,懂业务,懂用户,还能根据需求,丝滑地衔接到人工客服上面去;最后客悦还能做好客户分层,做好老客户的激活和挽回。
光是这么说可能不好理解,接下来我还是以金融场景为例,我来扮演一个购买了理财产品的用户,现场拨通客悦的数字人客服,我看看它是如何思考,如何解决问题的。
AI数字人客服:“您好,我是理财顾问芝晗,请问您有什么问题咨询?
沈抖先生:“你好。我今早买了一款个人养老金理财产品,现在就想退掉。请马上给我处理一下。”
AI数字人客服:“您别着急,我先确认下,您想退掉的产品,是今天上午9点购买的「最短持有365天固收增强个人养老金理财」对吗?”
沈抖先生:“对,就是这个。”
AI数字人客服:“没问题,这款产品今天17点前都是可以撤单的。给您在手机银行推送了撤单卡片,您点击确认,按提示输入指纹,就可以完成撤单了。
AI数字人客服:“看到您已经成功操作撤单了。看来您对之前那款产品可能不太满意,我们还有一些收益不错的理财产品,占用您一分钟,给您介绍下吧。”
沈抖先生:“行,我想看一些风险比较低的产品”
AI数字人客服:“我们有几款不同期限的稳健型理财产品,收益都还不错,您可以看一下。“
沈抖先生:“简单点儿,我只对孩子教育和父母养老相关的产品感兴趣。”
AI数字人客服:“那给您推荐几款符合需求的理财产品,可以看下哈,为了确保您的资产配置和收益更符合预期,给您预约客户经理详细沟通一下,可以吗?“
沈抖先生:“行,没问题。”
AI数字人客服:“那您保持手机畅通,稍后客户经理会联系您,您看还有其他问题咨询吗?”
沈抖先生:“没有了,谢谢”
以前,用户要撤单,非常繁琐。用客悦·ONE,整个流程就很简单。它不但能解决问题,还能识别和安抚用户的情绪,用户体验更好。对话结束后,它还能自动总结会话信息,把关键信息回流到数据基座,不断优化服务体验。

如果我们说客悦ONE是“听懂”了用户,我说的另外一个产品叫一见,就是让我们“看懂”这个世界。
过去,面对一个视觉场景,开发一个视觉模型,训练周期长、门槛高、需要很多算法工程师做开发。即便这样,大量复杂视觉场景仍不能被量化管理。
我们的产品一见,今天迭代到了5.0版本,大幅降低了落地成本。我们不敢说一句话就能解决所有问题,但在一些标准化程度高、规则清晰的任务中,确实已经可以通过一句话,生成专业级的视觉AI应用,即使是一线业务人员也能参与开发。更重要的是,通过云边协同,成本也会大幅下降。

我相信在座不少人有过这样的体验,就是你点外卖的时候遇到过漏送、送错的这种情况,比如少给你送了餐具或者点了薯条没给番茄酱,非常影响心情。但你要考虑到店面的员工每天要处理大量的这种个性化的需求,他们是很不容易的。我们有一个客户,是一家餐饮连锁企业,同时管好几百家门店,难度更大。
接下来我们就看一下一见怎么来解决这个问题。比如在餐厅的后厨来了一个汉堡的订单,顾客备注说不要酸黄瓜,如果这个厨师在操作过程中误放了酸黄瓜,那么他的手环就会提醒他,这时候厨师自然就会纠正,这样就可以避免一次客户的投诉。
误放酸黄瓜只是诸多生产流程里面的一种情况,其实连锁店经营过程中遇到大量的各种各样的不符合订单规则的情况,我们就以汉堡制作为例来演示一下这类问题用一见怎么解决。
首先我们要告诉一见,比如说帮我生成一个应用,分析一下汉堡制作是不是符合规范,提这样一个需求,然后我们点击发送。这时候我们就看到一见理解了我的意图,他已经在分析一个标准的汉堡的制作流程,分析完了之后我们就点击一个立即创建,其实这时候就生成了一个应用,我们这时候打开应用看一下,可以看到他用小模型来做汉堡制作过程的实时的检测分析,而大模型它理解了整个汉堡制作的过程,所以它就可以判断整个制作过程是不是符合订单的要求,在不符合订单要求的时候就可以产生预警,而这些参数其实都可以配置,在这里我们就直接发布。
AI视觉应用发布之后,一见就会根据你多个门店不同的情况来关联AI视觉的应用,推荐相应的店铺。我们关联之后点击“运行计划”,其实这时候 AI视觉应用在你的门店里面就已经自动的运行起来了。
所以像这样的视觉系统其实还有很多,比如说给餐厅做食品安全的分析,给工厂做安全生产的检测等等,所以一见已经在餐饮能源制造等领域已经在广泛的使用,而且这些能力可以被开发者非常容易地集成到自己的系统里面去。

前面给大家分享了算力模型开发和应用开发等等以及几款应用,这些其实也正好对应了大家在做AI应用开发的时候所常见的过程。
第一个选场景,我们要选择合适的场景,哪些场景怎么选,我们可以参考千帆上的这些标准的案例。
接下来我们要做产品,产品要用到大模型的能力,刚才我们也讲了模型的微调以及应用的开发。
最后到我们做规模化的时候,我们的量就会上来。推理成本就会变得很关键,而且这些数据回流之后还要去做模型的微调,我们这时候就会通过百舸和昆仑芯来为大家提供这种高效低价的算力支持。
总之这是一套开放的系统,而企业可以加上自己的数据流程和逻辑,把这套能力转化成企业自有的AI基础设施。

大屏幕上显示是70年代武汉钢铁厂的一个老照片,那时候武钢从海外引进了最先进的轧机系统,开启了引进国外钢铁技术的先河。过去50年,我们不断地在讨论数字化转型和升级。现在如果我们再去讲“钢铁是怎样炼成的”,就是一个智能化创新的过程。

我们合作的这位央企客户,中国钢研,面向我国钢铁冶金企业,为它们提供从材料研发到分析测试的综合服务。它要解决的,不是某一个场景、某一家企业的问题,而是要搭建一套全栈基础设施,推动整个产业的智能化升级。
我们用了4个月的时间,和中国钢研团队一起,基于昆仑芯和百舸,搭建了专属的智算平台;在千帆上做模型精调,使用大、小模型结合的方式获得最佳效果;结合刚刚讲到的一见视觉平台,快速完成了表面缺陷检测、金相分析这些核心场景的应用开发,未来还会拓展到更多场景。

这就是一个系统的价值,它不是解决某一个问题,而是让企业自己拥有创造“创造的能力”,这种能力会成为整个AI生态发展的源动力。
我们会把这套能力全面的开放给我们的客户和伙伴,不管是行业应用、模型服务,还是数据服务、底层算力,每一层都有很大的合作空间、很大的创新机会。那么今天下午我们会有百度智能云生态大会。会上,我有更多的同事会给大家分享这方面的进展,也欢迎大家参与。

刚才讲了这么多技术,只有真的用起来才是王道。所以我们会继续坚定的投入刚才讲到的这些智能基础设施,继续去赋能我们的客户和我们的伙伴,让人工智能真的为大家所用,真的能帮我们提高生产效率,创造美好生活。谢谢大家。
评论
