顶着压力,百度发布文心一言,邀请测试开启

机器之心

机器之心报道

编辑:泽南、蛋酱

发布会撞车又如何,百度也拿出了多模态。

在业内人们的认知中,能造出国产 ChatGPT 的公司里,百度排名前列,然而文心一言发布前夕,OpenAI 率先发布了功能更为强大的多模态大模型 GPT-4,巨大的压力给到了百度这一边。这一次,文心能否回应人们的期待?

距离 GPT-4 发布仅 37 个小时后,答案就被揭晓了:

接下来,李彦宏还展示了文心一言的商业文案创作水平,包括给一家科技公司起名字、写 slogan、写新闻稿。

AI 要写好一篇稿子,除了需要准确理解我们的意图,还要有清晰的表达能力。

「对于语言大模型来说,这背后需要庞大的数据规模作为基础。人类常说『读万卷书』,而 AI 是『读书破千亿卷』。文心一言大模型的训练数据就包括万亿级网页数据,数十亿的搜索数据和图片数据,百亿级的语音日均调用数据,以及 5500 亿事实的知识图谱等,这让百度在中文语言的处理上,能够处于独一无二的位置,」李彦宏说道。

越来越多的研究和实践表明,大模型在参数体量达到某个量级时,就可能发生「智能涌现」,即使在没有专门训练过的领域,也能涌现出知识理解和逻辑推理能力。

我们无法将所有能力一一教给 AI,但通过大量数据的训练、数十亿的搜索请求,大量图片和知识图谱中的事实,在不断的训练过程中,文心一言拥有了通用化的能力。不知道文心一言目前的参数达到了多少。

第三个案例,是大家喜闻乐见的「数理逻辑推断」—— 李彦宏向文心一言发起了一个鸡兔同笼的挑战。

对于第一道题目,文心一言经过演算,认为可能是题出错了。

对于第二道题目,文心一言不但给出了正确结果,还详细给出解题步骤。

也就是说,文心一言能理解题意,并产生正确的解题思路,进而像学生做题一样,按正确的步骤一步步演算出正确答案。同时,它也具备敢于质疑的品质:不是我错了,也许是题目错了呢?

可以看出文心一言已具备了一定的思维能力,能够学会数学推演及逻辑推理这类相对复杂任务。

「文心一言的数学能力在过去一个月的内部测试中不断进步。当然,现阶段准确率还不是 100%,我们还需要给它更多的时间来学习和成长。」李彦宏说道。

作为国产大模型,李彦宏展示的第四个案例,就是「中文理解」。

这是一些其他大模型应该无法准确回答的问题:

解释「洛阳纸贵」、写「藏头诗」,还要「答出其中蕴涵的经济学原理」,嗯,这很考验 AI 对中文和中国文化的理解。百度文心一言的中文水平优势也体现得淋漓尽致了。

李彦宏强调,作为扎根于中国市场的大语言模型,文心一言具备中文领域最先进的自然语言处理能力。同时他坦承,文心一言目前对英文语种、代码场景的训练还不够多,表现还不够好,接下来还要加紧训练,不断完善这些能力。

多模态是未来的方向,最后一个案例展示了文心一言的多模态生成能力:

先是文生图和语音生成能力,然后有意思的来了,李彦宏说:「请将以上内容生成视频。」

「未来在文心一言的迭代速度上,你们会有感受,」李彦宏说道。

目前,已有 650 家企业宣布接入文心一言的生态。「生成式 AI 代表了新的技术栈,创造市场需求的爆发式增长。超强的自然语言理解、表达和推理能力。大模型能让任何公司距离自己的客户更近,人们能创造更好的客户体验,建立更强的竞争优势。」

百度认为,未来脑力劳动者的工作效率可以提升四倍,人们的工作方式会发生不可逆转的改变。

李彦宏也展望了生成式大模型带来的新机会:

第一,新型的云计算,未来的服务提供方式将成为 MaaS(模型即服务)。主流商业模式从 IaaS 变为 MaaS。文心一言将根本性地改变云计算行业的游戏规则。之前企业选择云厂商更多看算力、存储等基础云服务,未来更多会看框架好不好、模型好不好以及模型、框架、芯片、应用这四层之间的协同。

第二,行业模型精调。通用大模型和企业之间的中间层,具有行业 Konwhow,调用通用大模型能力,为行业客户提供解决方案。文心大模型,已经在电力、金融、媒体等领域,发布了 10 多个行业大模型。在各行各业都有机会。

第三,基于大模型底座进行应用开发,即应用服务提供商。当前,基于文本生成、图像生成、音频生成、视频生成、数字人、3D 等场景,已经涌现出很多创业明星公司,这些公司很可能就是未来的新巨头。每一家企业在这个阶段都有机会。

在李彦宏展示完文心一言的 Demo 之后,百度 CTO 王海峰上台分享了背后的技术与百度多年的技术积累。

王海峰表示,文心一言是新一代知识增强大语言模型,是在 ERNIE 及 PLATO 系列模型的基础上研发的。它的关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。前三项是这类大语言模型都会采用的技术,ERNIE 和 PLATO 中也已经有应用和积累,在文心一言中又有了进一步强化和打磨;后三项则是百度已有技术优势的再创新,也是文心一言未来越来越强大的基础。

在演讲的最后,王海峰说文心一言目前已经开放测试。即日起,首批用户可通过邀请测试码在官网体验产品。百度智能云即将面向企业客户开放文心一言 API 接口调用服务,在官网可申请加入文心一言云服务测试。

以上就是百度今天发布会的内容了。看完发布会,相信每个人都有自己的感受。有人也许对百度没做现场 Demo 不满,也有人愿意宽容看待。

我们不得不承认,百度至少迈出了一步。接下来,就是看国内在这方面能不能越走越快。

最后,机器之心也获得了文心一言的测试资格,我们会尽快带来体验报道。

探寻隐私计算最新行业技术,「首届隐语开源社区开放日」报名启程

春暖花开之际,诚邀广大技术开发者 & 产业用户相聚活动现场,体验数智时代的隐私计算生态建设之旅,一站构建隐私计算产业体系知识:

隐私计算领域焦点之性

分布式计算系统的短板与升级策略

隐私计算跨平台互联互通

隐语开源框架金融行业实战经验

3 月 29 日,北京 · 798 机遇空间,隐语开源社区开放日,期待线下面基。

点击阅读原文,立即报名。

THE END

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin.com

免责声明:本文来自王科嘉,不代表浮光掠影知识网 - 专注有价值知识的生活内容平台的观点和立场,如有侵权请联系本平台处理。

相关阅读

    发表评论

    表情:
    评论列表(暂无评论,1352人围观)

    还没有评论,来说两句吧...

    取消
    微信二维码
    微信二维码
    支付宝二维码