百度文心大模型再升级,生态布局初见成效

在10月17日举行的百度世界2023大会上,百度自研的大语言模型文心大模型最新版本——文心大模型 4.0对外发布。百度创始人、董事长兼CEO李彦宏表示,文心大模型4.0的综合能力“与GPT-4相比毫不逊色”。
人工智能 Baidu 百度
2023-10-20 17:53:33  |   作者:航标  |   来源:航标IT精选

百度文心大模型再升级,生态布局初见成效

在10月17日举行的百度世界2023大会上,百度自研的大语言模型文心大模型最新版本——文心大模型 4.0对外发布。百度创始人、董事长兼CEO李彦宏表示,文心大模型4.0的综合能力“与GPT-4相比毫不逊色”。
人工智能 Baidu 百度
2023-10-20 17:53:33
作者:航标
来源:航标IT精选

在10月17日举行的百度世界2023大会上,百度自研的大语言模型文心大模型最新版本——文心大模型 4.0对外发布。百度创始人、董事长兼CEO李彦宏表示,文心大模型4.0的综合能力“与GPT-4相比毫不逊色”。他现场演示了文心大模型的能力以及基于文心大模型重构的百度搜索、文库、地图、网盘等十余款AI原生应用。

clip_image001.png

百度文心大模型正式发布是今年3月,是ChatGPT引爆了大语言模型之后第一批问世的自研大模型之一。当时是3.0版,和此前的版本相比,文心大模型4.0的能力有全面的提升。同时,在大模型生态建设上也有很大进展,大模型全链路生态支持体系已经基本成型。根据百度的数据,从8月31日文心大模型正式对外开发以来,用户规模已经达到4500万,开发者5.4万,应用场景4300个,应用825个,插件超过500个。

四大能力提升,直接对标GPT 4

和3月份文心大模型的发布一样,文心大模型由李彦宏亲自发布。李彦宏在演讲时表示,文心大模型4.0是迄今为止最强大的文心大模型,其在四大能力上都有显著提升,这四大能力分别是理解、生成、逻辑和记忆能力。

图片2.png

李彦宏现场演示了文心大模型的这四大能力。李彦宏在介绍文心大模型的理解能力时,向文心一言提出 “我想回承德买房,能用公积金贷款吗?手续怎么办?我在北京工作”这样一个问题。这里面有几个隐藏的信息,比如“我因为在北京工作,公积金是在北京”以及“要在承德买房”。文心一言做出了正确的回答。回答表明它读懂了。

在生成能力方面,李彦宏现场演示了让文心大模型根据从官网收集的资料生成一个数字人播报的汽车视频广告。文心大模型很快提交了结果,生成的物料中有图片、有声音播报,数字人在说话时还配合有动作变化,很自然和流畅。

透过演示,我们可以看到文心大模型已经可以比较准确地理解对话时的“画外音”,能够记住之前的几轮对话内容,也能够根据用户需求写文章、写小说、出图片和视频等,也能做题。这也证明文心大模型在能力有了很大提升。根据百度 CTO 王海峰的说法,文心大模型 4.0 理解和生成能力的提升幅度相近,而逻辑的提升幅度是理解的 3 倍,记忆的提升幅度是理解的 2 倍。

百度一方面在提升文心大模型的能力,同时也在积极基于文心大模型对百度所有产品进行重构,这也是兑现李彦宏之前说过的话。今年5月份李彦宏就曾公开表示“百度要成为第一个将所有产品和应用都基于大模型进行重构的公司”,并且要用AI的思维做出AI时代的应用。

图片3.png

同样,李彦宏现场演示了接入文心大模型并进行重构后的百度产品,包括百度搜索、百度文库、百度地图、百度网盘等诸多产品。我们可以非常明显地感受到接入大模型后给这些应用带来的颠覆性的改变。比如,面对用户需求,百度新搜索已经不再只是给出链接而是直接给出答案,不仅如此,新搜索还能猜你所想,为你推荐你可能想要的内容。李彦宏用“极致满足、推荐激发、多轮交互”来概括百度新搜索的特点。

类似的还有百度文库。百度文库原本只是一个知识管理的平台,接入大模型之后变成了类似微软Office的生产力工具,它不仅可以根据用户需求,自己去找到所需的知识,还能更进一步自动生成PPT。

同样,大模型的颠覆能力在百度GBI上也体现得淋漓尽致。百度GBI是一个全新的BI产品,它在传统BI工具上接入了生成式AI能力,从而使得BI工具具有了理解能力。它能够与用户的交互,自动找到所需要的信息并以合适的方式呈现,从而大大提高了BI的生产效率,同时也降低了使用门槛。而且,百度GBI还具有学习能力,用户可以注入自己所在行业的专业知识,让GBI成为一个行业专家。

图片4.png

智能代码助手Comate也是百度基于文心大模型研发的新产品。目前已经在百度内部得到应用,整体采纳率已经达到了40%,高频用户代码采纳率更是高达60%,现在百度每天新增的代码中20%是由Comate生成。

“我们基于更大的算力、更多的数据、更强的算放,训练除了规模更大、效果也更好的大模型,这就是文心大模型4.0。”王海峰在演讲时表示。

构建大模型生态

百度研发文心大模型的目的并不是只是满足自身的需求,而是希望能让更多人享受这一技术的红利。因此,百度在持续打磨文心大模型时,生态建设也是同步推进。

插件平台灵境矩阵就是百度为扩展文心大模型的能力边界、繁荣大模型生态的重要举措。借助文心大模型的插件开发机制,无论是个人还是企业的数据或者是应用,都能够通过灵境矩阵平台上快速变成一个插件,利用 API 接入文心大模型的能力中,使得企业私有数据在没有泄露风险的情况下就能快捷地接入最先进的文心大模型,从而方便地打造出更多个性化的应用。

据悉,灵境矩阵平台上线仅一个月的时间,就已经有 2.7 万个开发者的申请入驻,覆盖了 20 多个领域,包括法律咨询、简历生成,脑图制作、口语练习等场景。

图片5.png

在大模型生态打造上的另外一个重要举措是百度智能云千帆大模型服务平台。这是一个AI原生应用的开发工作台,借助这个大模型平台,企业可以快速调用包括文心大模型在内的各种大模型API,借助这些大模型的能力打造自己的AI应用。

目前,千帆大模型服务平台已经有42个主流的大模型入驻,有17000多家客户在这里开发产业模型和解决方案,覆盖近500个场景。同时,新的企业和开发者还正在不断地涌入千帆,大模型调用量高速攀升。

作为繁荣生态的重要一环,百度智能云还推出了一站式交易的AI原生应用商店,目前已经优选了一批应用,来自金蝶、金山等一批精选应用已经正式上线。另外,大会上百度还发布了人才培养星河计划化,宣布要为社会培养500万大模型人才。

图片6.png

值得一提的是,在大模型生态的构建中,百度云将成为不可或缺的角色。百度云是最早提出“云智一体”的云服务商,随着文心大模型的推出,“云智一体”有了一个更为坚实的支点。比如,千帆大模型服务平台和AI原生应用商店都落地在百度智能云上,同时,百度智能云的最佳算力效能的智算基础设施可以为客户的AI原生应用提供更好的支持。据悉,经过文心大模型的锤炼,百度智能云分布式训练加速比达到95%,有效训练时间占比达到96%。

“大模型时代来了,风起云涌,有的在弄潮,有的在逐浪,我们致力于打造一艘坚实的大船。我们要用更高效的算力基础设施、更好用的一站式大模型平台、更多服务的行业解决方案和百花齐放的AI原生应用,和客户、合作伙伴一起迎接未来。”百度智能云事业群总裁沈抖在演讲时表示。