“中国版ChatGPT”文心一言来了，百度能飞上AI风口吗？ - 从自动化的角度聚焦物联网的发展-控制工程网

社区公告

物联网与自动化一脉相承，本社区从工业控制和自动化的角度解读物联网产业的发展，向您介绍最新动态、技术和应用。欢迎您加入社区第一时间得到社区更新。

社区成员更多>>

其他行业社区

您所在的位置：首页 > 产业动态

“中国版ChatGPT”文心一言来了，百度能飞上AI风口吗？
发布时间：2023-03-17 www.cechina.cn
　　被外界誉为“中国版ChatGPT”终于来了。
　　李彦宏：文心一言确实不完美，发布是因为有市场需求。
　　
　　3月16日，百度在北京召开新闻发布会，宣布“文心一言”正式发布。
　　百度创始人、董事长兼首席执行官李彦宏出席及百度首席技术官王海峰出席，并展示了“文心一言”在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。
　　发布会上，百度公布了“文心一言”的邀请测试方案。3月16日起，首批用户即可通过邀请测试码，在“文心一言”官网体验产品，后续将陆续开放给更多用户。此外，百度智能云即将面向企业客户开放“文心一言”API接口调用服务。3月16日起正式开放预约，搜索“百度智能云”进入官网，可申请加入“文心一言”云服务测试。
　　
　　然而，市场给出的反应并不如预期。百度盘中股价跌幅一度扩大超10%，报120.1港元，截至发稿，跌幅收窄至7.34%，报123.8港元。
　　
　　李彦宏：对标ChatGPT门槛很高，百度是全球大厂第一个
　　据李彦宏介绍，百度在过去十几年间一直在AI研发上持续投入，文心大模型的第一个版本在2019年就发布了，此后每一年都要发布一个新的版本。
　　“全球大厂中百度是第一个发布的”，李彦宏坦承，这段时间不断有人问他为什么现在发布“文心一言”，百度是否真的准备好了，“从我自己在内测过程中体验到的“文心一言”的能力来说，当前确实不能叫作‘完美’”。李彦宏表示，发布是因为有市场需求——百度的各个产品线都在等待这样的技术，客户也在等待，因而需要尽早推出。
　　
　　人类进入人工智能时代，IT技术的技术栈发生了根本性变化，从过去三层到“芯片-框架-模型-应用”四层。李彦宏认为，百度AI全栈布局的优势在于，可以在技术栈的四层架构中实现端到端优化，大幅提升效率。尤其是框架层和模型层之间，有很强的协同作用，可以帮助构建更高效的模型，并显著降低成本。
　　李彦宏预测，大语言模型将带来三大产业机会。第一类是新型云计算公司，其主流商业模式从IaaS变为MaaS。“文心一言”将根本性地改变云计算行业的游戏规则。“文心一言”将通过百度智能云对外提供服务，帮助企业构建自己的模型和应用。
　　第二类是进行行业模型精调的公司，这是通用大模型和企业之间的中间层，他们可以基于对行业的洞察，调用通用大模型能力，为行业客户提供解决方案。
　　第三类是基于大模型底座进行应用开发的公司，即应用服务提供商。李彦宏断言，对于大部分创业者和企业来说，真正的机会是基于通用大语言模型抢先开发重要的应用服务，这可能才是真正的机会。目前，基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景，已经涌现出很多创业明星公司，可能就是未来的新巨头。
　　
　　“文心一言”与GPT-4同台竞技
　　值得注意的是，在百度正式发布“文心一言”的前一天，因为ChatGPT爆火的OpenAI再次发布新模型——GPT-4。
　　
　　与此前的版本相比，GPT-4具备强大的识图能力，文字输入限制也提升至2.5万字；GPT-4的回答准确性也显著提升，还能够生成歌词、创意文本从而实现风格变化。同时，GPT-4在各类专业测试及学术基准上也表现优良。
　　“这是OpenAI努力扩展深度学习的最新里程碑。”OpenAI介绍，“GPT-4是一个大型多模态模型，它接受图像和文本输入、进行文本输出，虽然在许多现实场景中它尚且不如人类，但在各种专业和学术基准上表现出与人类相当的性能。”
　　OpenAI新模型的发布，又一次次点燃了再次点燃整个科技圈的想象力。“见证历史了。”看到GPT4的发布后，有多位业内人士感叹道。
　　而原本定在第二天发布、被业内称为“中国版ChatGPT”的百度“文心一言”，毫无疑问就这样站在了与GPT-4同台竞技的舞台上。
　　据百度宣布，目前已经有包括互联网、媒体、金融、保险、汽车、企业软件等行业的650家企业宣布加入百度“文心一言”生态。
　　虽然不至于肩负“全村唯一的希望”，但市场普遍认为，“文心一言”之于2023年的百度，或将成为一个期盼已久的拐点。
　　
　　“文心一言”实力如何？
　　从现场展示来看，“文心一言”某种程度上具有了对人类意图的理解能力，回答的准确性、逻辑性、流畅性都逐渐接近人类水平。但李彦宏也多次提及，这类大语言模型还远未到发展完善的阶段，进步空间很大，未来这段时间它一定会飞速发展，日新月异。
　　在文学创作场景中，“文心一言”根据对话问题将知名科幻小说《三体》的核心内容进行了总结，并提出了五个续写《三体》的建议角度，体现出对话问答、总结分析、内容创作生成的综合能力。此外，“文心一言”准确回答了《三体》作者、电视剧角色扮演者等事实性问题。面对“于和伟和张鲁一有哪些共同点”、“于和伟和张鲁一谁更高”这类问题，“文心一言”也基于推理能力得出了正确答案。
　　
　　连续三次内容创作生成中，“文心一言”既能准确理解人类意图，又能清晰地表达，这是基于庞大数据规模而发生的“智能涌现”。“文心一言”大模型的训练数据包括万亿级网页数据、数十亿的搜索数据和数据、百亿级的语音日均调用数据，以及5500亿事实的知识图谱等。
　　“文心一言”还具备了一定的思维能力，能够学会数学推演及逻辑推理等相对复杂任务。面对“鸡兔同笼”这类锻炼人类逻辑思维的经典题，“文心一言”能理解题意，并有正确的解题思路，进而像学生做题一样，按正确的步骤，一步步算出正确答案。
　　多模态生成方面，李彦宏现场展示了“文心一言”生成文本、、音频和视频的能力。“文心一言”甚至能够生成四川话等方言语音；“文心一言”的视频生成能力则因成本较高，现阶段还未对所有用户开放，未来会逐步接入。
　　
　　据王海峰介绍，新一代知识增强大语言模型“文心一言”，是在ERNIE及PLATO系列模型的基础上研发的。它的关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。前三项是这类大语言模型都会采用的技术，ERNIE和PLATO中已经有应用和积累，在“文心一言”中又有了进一步强化和打磨；后三项则是百度已有技术优势的再创新，也是“文心一言”未来越来越强大的基础。
　　在知识增强方面，“文心一言”的知识增强主要是通过知识内化和知识外用两种方式。知识内化，是从大规模知识和无标注数据中，基于语义单元学习，利用知识构造训练数据，将知识学习到模型参数中；知识外用，是引入外部多源异构知识，做知识推理、提示构建等等。
　　在检索增强方面，“文心一言”的检索增强，来自以语义理解与语义匹配为核心技术的新一代搜索架构。通过引入搜索结果，可以为大模型提供时效性强、准确率高的参考信息，更好地满足用户需求。
　　在对话增强方面，基于对话技术和应用积累，“文心一言”具备记忆机制、上下文理解和对话规划能力，实现更好的对话连贯性、合理性和逻辑性。
　　“百度特有的技术，现在已经应用在文心一言上”，王海峰也坦言，技术有了，但是大模型的训练的还不够充分。不过文心大模型建立起人类反馈、奖励模型和策略优化之间的飞轮机制，随着真实用户的反馈越来越多，“文心一言”的效果会越来越好，能力越来越强。
　　
　　那些年，百度错过的风口
　　百度作为中国最大的搜索引擎和互联网公司之一，自2000年成立以来经历了许多机遇和挑战，也取得了巨大的成就。但是从2010年开始，百度由于各种各样的原因和失误，错失许多风口。
　　从财报上来看，2010-2015年，百度主要的战略主要是：拓展视频业务和深化垂直搜索布局。
　　2010年百度成立奇艺网（爱奇艺前身），2012年，百度控制了爱奇艺的控股权，并在2013年收购PPStream，与爱奇艺合并。
　　2011年，百度取得了去哪儿网的控制权，目的是通过搜索+旅游领域的结合为有旅游需求的用户提供更精准的信息。
　　2011年，百度投资安居客，目标是占领地产类搜索的高地。
　　值得注意的是，2011年百度有啊（电子商务平台）与百度说吧关闭，标志着百度退出了电商与社交网络的业务试水。
　　在此阶段，百度的业务中心仍在是深挖本身的优势—搜索，继续巩固自身通用搜索的地位，同时融合垂直领域搜索与通用搜索的结合。百度此阶段的成功主要还是搜索业务的红利期还在，以及谷歌退出给百度带来的当仁不让的地位。
　　2013年，百度出资19亿美元收购91无线已发行的全部股本，这笔收购被看作是百度在试图努力追上移动互联网的步伐。然而，很多观点认为，91无线的估值是偏高的。
　　因为当时各个手机厂家都开始集合自己的应用市场，厂商们集中在这一阶段进行互联网化，以小米为代表的先驱已经开始创造自己的应用商店平台。而像腾讯这样的巨头，靠着QQ等社交巨无霸研发出的应用宝顺着4G和Wifi时代一骑绝尘。因此，91无线并没有看上去那么高（19亿美金）的价值。
　　2015年，百度正式意识到移动互联网业务的重要性，这一年百度对集团组织结构进行了调整，2015年2月2日，李彦宏群发邮件，决定“将重心转向移动互联网，扩大百度在移动入口的优势。”而这距离2011年腾讯推出微信已过去了四年。
　　由于没有及时跟上移动互联网的趋势进行早期商业布局，百度后续针对移动互联网的布局都略显被动。此后，无论是各种APP争夺用户和打车软件烧钱PK、还是百团大战，亦或电商疯狂补贴，这些超级APP的发展故事中鲜少出现百度的身影。
　　
　　这一次，百度能飞上AI风口吗？
　　在互联网巨头和后起之秀的前后夹击下，错失互联网风口的百度选择了全面进军AI，成为了全国第一个提出“ALL in AI”的科技公司。
　　自2010年开始，百度开始布局和构建AI技术体系。2013年-2014年，百度成立了百度美国研究院、百度深度学习研究院两大研究院，以及大数据实验室、硅谷人工智能实验室两个实验室；2017年7月首次发布人工智能开放平台的整体战略、技术和解决方案，正式宣布All In AI。
　　投入至今，百度在AI技术架构的芯片层、框架层、模型层和应用层都做了全栈布局。从高端芯片昆仑芯，到飞桨深度学习框架，再到文心预训练大模型，百度在各个层面都有关键自研技术，这在国内堪称独树一帜。
　　其中，模型层是近年来IT技术栈全新增加的分类，背后蕴藏着一场人工智能落地模式的变革。百度是构建大模型的先驱之一，根据IDC发布的《2022中国大模型发展白皮书》指出，百度旗下文心大模型在市场格局中处于第一梯队，产品能力、生态能力、应用能力全面领先，受到行业广泛认可。
　　
　　在应用层面，百度搜索、百度智能云、百度无人驾驶汽车等业务均处在业界领先位置，将是“文心一言”落地应用的最佳土壤。
　　在研发层面，百度是中国研发投入强度最高的科技企业之一。据最新发布的百度2022财年业绩报告，全年实现营收1236.75亿元，净利润（非美国通用会计准则）206.8亿元，同比增长10%；核心收入连续四个季度业绩超市场预期。财报显示，2022年百度核心研发费用达到214.16亿元，占百度核心收入比例达22.4%。
　　目前，百度已经形成了以AI为核心，以智能云、智能驾驶、AI服务平台飞桨、百度大脑、智能音箱小度、元宇宙希壤、数字人希加加、度晓晓的全景生态。
　　与此同时，百度对AI的投入也是巨大的。过去10年，百度在AI的潜伏期坚持投入，研发总额超过千亿元，因而打造了强大的AI技术护城河。国家知识产权局知识产权发展研究中心发布的《中国民营企业发明专利授权量报告（2021）》也显示，百度位居Top10，其中AI专利授权连续5年获得第一。
　　自ChatGPT走红后，“文心一言”站上了百度发展的C位。在百度的设想中，“文心一言”将与现有业务深度融合，带来新的商业可能。李彦宏在电话会议上表示，百度计划将多项主流业务与“文心一言”整合。一是与搜索整合；二是通过百度智能云对外提供服务；三是将“文心一言”大模型搭载到Apollo智舱系列产品；四是与小度进行集成。
　　但百度能否凭借“文心一言”打个翻身仗，目前看来仍然未可知。