周鸿祎万字分享:2024大模型发展的机遇之年,企业如何拥抱AI?
分 享 | 周鸿祎
来 源 | 长江商学院EMBA
1月24日,360集团创始人、长江商学院CEO8期校友周鸿祎同学,在长江商学院EMBA“至诚讲坛”公开课中指出,大模型的出现,意味着AI将能够更为灵活地应对各种挑战和问题。它不再是一个只能执行特定指令的机器,而是开始具备一定的自主学习和决策能力。这无疑为我们打开了一个全新的世界,让我们看到了AI未来的无限可能。
当然,我们也必须清醒地认识到,当前的AI技术仍然存在诸多限制和不足。要实现真正的通用人工智能,还有很长的路要走。我们需要持续投入研发,不断突破技术瓶颈,才能让AI更好地服务于人类社会。
大模型是如何出现的?
过去,我们所称的AI,往往只能完成一些单一且有限的任务,如人脸识别、语音助手等。这些技术在某些特定场景下或许能够发挥一定的作用,但离真正意义上的智能化还有很大的差距。因此,有人戏称其为“人工智障”,也不无道理。
然而,随着时间的推移,特别是到了2023年,AI领域迎来了重大的突破。这一年,我们看到了技术的飞速进步,AI开始展现出更为强大的能力。它不再局限于单一任务或领域,而是能够用通用的算法去完成过去需要很多专项任务才能完成的任务。这就是我们所说的通用人工智能(AGI)的雏形。
大模型成功涌现的关键因素
这次大模型的成功涌现,可谓是一次“大力出奇迹”,类似于吴宇森所倡导的“暴力美学”的新典范。其关键要素主要有以下几点:
1、算法基石早已奠定:神经网络、深度学习以及Google推出的Transformer算法等,都为这次大模型的出现提供了必要的算法基础。
2、算力的历史性积累:随着互联网的发展和GPU技术的进步,人类所积累的算力已经达到了一个新的阶段。在过去,我们或许已有成熟的算法和构思,但由于算力限制而无法实现。如今,算力的提升为大模型的成功提供了重要保障。
3、海量知识与数据的融合:互联网的普及创造了大量知识和数据。OpenAI等机构在Transformer大模型的训练中巧妙地融入了这些知识,打破了以往实用主义的局限,引领了大模型的新发展。
与以往科技巨头注重实用主义不同,OpenAI的投入和愿景更具前瞻性和颠覆性。他们致力于将人类所有知识融入模型中,从而引发了质变,催生了ChatGPT等具有划时代意义的成果。
需要澄清的是,大模型并非仅限于自然语言处理领域的应用。其强大的影响力和潜力正在逐步渗透到各个领域。通过攻克语言理解这一核心难题,大模型使得人工智能能够更自然地与人类交流,进而更深入地理解和描绘世界的知识。这种理解不仅提升了电脑的语言掌握能力,更让其对世界架构有了全面的认识,为各种复杂任务提供了有力支持。
以日常生活中的场景为例,大模型能够理解并处理类似“前往东方广场长江商学院进行交流”这样的自然语言指令。这得益于大模型对词汇和语境的深入理解和学习能力。这也是大模型与传统搜索引擎的显著区别之一。大模型更注重知识的理解和推理,而非简单的关键词匹配和网页索引。
在训练过程中,大模型通过学习大量数据来掌握背后的能力和范式。这种能力使得大模型在处理类似问题时能够举一反三、灵活应变。同时,大模型也会对数据进行压缩和优化,以提高处理效率。但需要注意的是,这种压缩并非简单地减少数据量,而是通过提取关键信息和模式来实现的。
尽管大模型在知识细节方面可能存在一定不足,但其强大的处理能力和泛化能力使得它在自动驾驶、机器人技术等领域具有广泛的应用前景。
大模型的训练过程
大模型的成功应用可以归结为四个关键步骤。
首先是预训练,这一步骤类似于我们不断地学习新知识,积累经验。大模型通过吸收海量的数据和信息,逐渐建立起对世界的认知和理解。正如中国古话所说,“书读百遍,其义自见”,当大模型接触到足够多的数据时,它就能够将这些知识融会贯通,形成自己的理解和判断。
接下来是微调,这一步骤旨在教会大模型如何更好地与人交流,回答问题。通过针对性的训练和调整,大模型可以逐渐学会用人类易于理解的语言和方式来表达自己的想法和观点。
第三步是对齐,这一步骤至关重要。因为知识本身并无好坏之分,但大模型的想法和行为必须遵循人类的道德和价值观。通过对齐过程,我们可以确保大模型在回答问题、提供建议时不会偏离正确的轨道,不会做出违背人类伦理和道德的行为。
最后一步是应用,即将大模型应用于实际场景中,与人类进行互动和交流。在这一步骤中,人类可以通过提问、提供反馈等方式来引导大模型的行为和思考。同时,大模型也能够根据人类的需求和偏好来不断优化自己的表现。
大模型的智能表现并非空穴来风。它的成功离不开海量数据的支持、先进算法的应用以及持续不断的优化和调整。相比之下,一些其他技术如web3虽然被寄予厚望,但至今仍未看到其真正的爆发性增长和对生活工作的实质性改变。而人工智能在2023年的短短一年时间里却展现出了惊人的发展速度和应用潜力。这充分说明了大模型作为人工智能技术的重要代表,正在引领着新一轮的科技革命和创新浪潮。
如何正确看待大模型?
在人工智能的浪潮中,大模型以其卓越的综合能力逐渐崭露头角,不仅在多个领域展现出超越人类的实力,更在各类专业考试中如鱼得水,令人叹为观止。然而,在为大模型喝彩的同时,我们也需要理性地审视其局限与潜能。
首先,尽管大模型表现出色,但我们不能过分夸大其能力。它们在某些领域,如数学、物理等科学问题上,仍可能存在理解的短板。此外,“杜撰”也是大模型的一个显著问题,即它们有时会编造出并不存在的信息。这种现象在某些关键领域,如医药等,可能会引发严重的后果。因此,在应用大模型时,我们需要保持警惕,避免盲目依赖。
然而,这并不意味着我们应该低估大模型的未来潜力。科技的飞速发展已经证明,一旦达到某个拐点,进步的速度将呈指数级增长。大模型作为人工智能领域的新星,正展现出前所未有的发展趋势。
近期,扎克伯格的豪言壮语在人工智能领域掀起了波澜。他炫耀的庞大算力不仅支撑了人工智能训练的巨大需求,更预示着未来可能的惊人发展。有人担忧人类的知识将被迅速耗尽,但事实上,随着技术的进步,人工智能有望通过自我生成知识等方式不断扩充其知识库,打破这一局限。
除了算力的提升,人工智能领域还在积极探索新的训练方法。利用人工智能产生的知识来训练人工智能本身,已经成为一种前沿且充满潜力的研究方向。这种方法不仅能够持续生成新的训练数据,推动人工智能的不断学习和进步,还有望为我们解锁更多未知的可能性。
同时,多模态学习的崛起也为人工智能的发展注入了新的活力。随着多媒体内容的日益丰富,人工智能已经能够同时处理文本、图像、视频等多种类型的数据,从而获取更加全面和深入的知识和信息。可以想象,如果全世界的摄像头都能够为人工智能提供学习素材,那么未来人工智能的增长曲线将是何等的惊人。
大模型的发展和安全
随着GPT和国内大模型的兴起,人工智能开始引起广泛关注。大模型技术通过模拟人类的打字交流方式,使得人工智能概念迅速火遍全球。然而,许多人可能仅将大模型理解为聊天机器人,实际上,它的潜力远不止于此。
大模型的三个应用方向
1、机器人
大模型技术为机器人产业注入了新的活力。过去,训练机器人需要针对每个任务进行繁琐的规则训练,而现在,大模型使得机器人能够更深入地理解世界并做出相应的动作。这种技术进步预示着机器人领域将迎来重大的突破,机器人有望在更多领域发挥更广泛的作用。
2、自动驾驶
大模型技术也有望推动自动驾驶领域的发展。当前的自动驾驶系统主要依赖感知层面的技术,如雷达和摄像头。然而,大模型技术的引入将使得车辆能够像人类驾驶员一样进行深度思考,准确判断道路上的障碍物并做出决策。这将显著提升自动驾驶系统的安全性和可靠性,推动其向更高层次的发展。
3、科学研究助手
大模型技术不仅可以用于语言交流和个人助理等方面,还有望成为科学研究的得力助手。在生物、疾病研究以及物理学、数学等领域,大模型可以协助科学家进行复杂的数据分析和理论推导。这种技术的应用将加速科学研究的进展,推动人类社会的进步。
随着算力、数据和训练方法的成熟,大模型技术的应用门槛逐渐降低。关键在于如何巧妙地将大模型技术应用到实际场景中,发挥其最大的潜力。现在,国内外都认识到大模型技术正引领新一轮的工业革命,将重塑各个行业。因此,我们需要思考如何在自己所在的行业中充分利用大模型技术,带来真正的变革。
与将大模型比作操作系统不同,大模型更可能像PC一样无处不在。未来,每个政府、企业和个人都可能拥有自己的大模型,这将导致大模型更加分布式和私有化。同时,随着大模型技术的发展,数字分身等前沿应用也将成为可能。这将为我们提供全新的数字体验,甚至实现某种程度的数字永生。
此外,大模型也将广泛应用于各种终端设备中,如手机、家庭设备等。这将为用户提供更加智能化和便捷的服务。特别是在汽车行业,没有大模型的汽车将很快被淘汰。有了大模型,汽车可以与我们进行充分的对话,管理整个自动座舱和娱乐系统,提供比现在更先进的体验。
因此,我们应该积极拥抱大模型技术,思考如何将其与我们的行业结合,创造更多的可能性并抓住机遇实现创新。这将是一场深刻的行业变革,也是我们抓住第四次技术革命机遇、推动社会进步的关键所在。
大模型的发展和安全问题
关于大模型的发展及其伴随的安全问题,目前国际上主要存在两种对立的观点。
一方面,“安全派”主张对大模型的发展持谨慎甚至限制态度。他们认为大模型潜在的风险可能对人类构成不可逆转的威胁。这些担忧在军事领域的应用上尤为突出,例如OpenAI最近取消了对人工智能进入军事领域的限制,美国国防部已开始尝试利用大模型进行各种应用,这无疑加剧了对大模型安全性的关注。
另一方面,“发展派”则坚信大模型是推动社会进步的重要工具。他们认为,大模型的应用将为个人和企业提供强大的知识助手和支持力量,有助于解决各种问题,推动社会经济的飞速发展。这种乐观态度得到了大模型在各行各业广泛应用的支持,这些应用实例展示了其对行业发展的巨大推动力。
然而,无论持哪种观点,我们都不能忽视大模型发展中的安全问题。为了确保大模型的安全性和可控性,需要加强技术研究和监管措施,防止其被恶意利用或产生不可控的后果。同时,还需要解决内容安全问题,确保大模型生成的内容可信、可靠。
在推动大模型发展的过程中,深入理解其原理和机制至关重要。我们需要探索如何将大模型的能力限制在可控范围内,使其成为服务人类的有益工具,而不是潜在的威胁。此外,利用大模型自身的优势来监控和纠正其行为,也是确保其安全性的有效手段。
国家也提了一个口号“数转智改”。“数转”即数字化转型,强调以大模型为基础,推动各行各业的数字化进程。没有数字化转型,就无法收集到足够的数据,进而提炼出有价值的知识来训练自己的大模型。而“智改”则是指智能化改造或智能化升级。
大模型如何在企业落地?
企业使用大模型遇到的问题
企业在应用大模型时,确实遭遇了多重挑战。尽管大模型利用公共知识和数据训练而成,但企业内部珍贵的“暗知识”,如专有图纸、独家配方和独特管理流程,才是其竞争核心。这些独特的信息资产在通用大模型中往往得不到充分利用。
问题的症结主要有两点:
行业深度不足。通用大模型在回答基础、普遍性问题时或许游刃有余,但一旦触及专业领域的深层次问题,便显得捉襟见肘,甚至可能给出误导性信息。
企业适配性差。通用大模型难以充分理解和适应企业的特定环境和需求,这限制了其在企业场景中的有效应用。
此外,数据安全问题亦不容忽视。将敏感的企业内部信息输入外部大模型,存在泄露或被滥用的风险。因此,私有化部署成为确保数据安全的关键。
大模型的“胡言乱语”问题在企业环境中尤为严重。个人使用或许可以容忍偶尔的不准确,但在企业场景下,这种失误可能导致严重的业务后果,如误发警报引发的混乱。
成本问题同样是中小企业面前的难题。通用大模型训练所需的高昂算力和资源成本,让许多企业望而却步。因此,未来大模型的发展应更加注重产业化、垂直化、企业化和行业化定制,以满足不同企业的实际需求。
这种发展趋势将为产业界带来前所未有的机遇。与互联网领域不同,产业界拥有广阔的应用场景和待开发的市场。结合企业的“暗知识”训练大模型,将有效解决各类业务问题,推动产业持续发展。
预计未来大模型将呈现双轨发展态势:一方面,互联网巨头将继续在云端推动大模型研发,探索人类智能的新高度;另一方面,企业级模型将更加注重成本效益和实用性,通过“蒸馏”等技术将大型模型精简为高效、低成本的小型模型,同时保持其性能优势。
对于许多企业来说,构建千亿模型成本高昂且不实用。相反,百亿模型经过优化后可在单台电脑上运行,成本低且易于扩展。虽然规模较小,但百亿模型在特定领域内表现出色。
随着大模型技术的普及,关键在于将其应用于具体场景并结合企业知识进行训练。要将大模型与企业业务紧密结合,需要技术和业务洞察力。未来,AI将成为企业核心竞争力,掌握AI技术的人才将具有竞争优势。因此,企业应积极推动AI的普及和应用,培养员工对AI的认知和信任,以应对新的工业革命。
“含AI量”考核
在当今企业应用AI的实践中,我们观察到两个核心层次:首先,是利用AI的通用产品来掌握其工作原理、局限性,并据此优化内部业务流程;其次,是探索如何借助AI强化对外提供的产品和服务。尽管常有人问起如何在企业中有效运用AI,但现实是,目前能够独立运用AI创造出全新产品的案例仍然不多。
2023年,我们面临一个现实:尽管大模型技术持续进步,但它们仍非完美无缺,潜力巨大却尚未充分发挥。因此,我们尚未见证AI带来的那种颠覆性应用。然而,这并不意味着我们无法从AI中获得实际价值。微软和SalesForce的成功案例就是明证。它们并未尝试创造全新的产品,而是巧妙地将AI技术融入现有产品线中,从而提升了用户体验和产品价值。
这引发了对创新本质的思考。创新并不等同于发明,有时候将现有产品以新的方式呈现也是一种创新。对于非IT背景的人来说,要求他们利用AI创造全新产品可能不切实际。相反,我们可以借鉴微软和SalesForce的策略,谨慎地在现有产品中融入AI技术,逐步实现创新和改进。
为了推动AI在企业中的广泛应用,我提出了“含AI量”的概念。这意味着需要培训员工掌握AI基本原理和应用场景,并将其纳入考核体系。只有这样,我们才能培养出对AI有深入了解的先行者,引领公司与AI的深度融合。如果公司对AI一无所知,仅仅购买一个大模型是无法实现实质性变革的。因此,“含AI量”不仅是对员工技能的要求,更是公司推动数字化转型、提升竞争力的重要指标。
与云计算和大数据技术不同,AI的应用高度依赖于具体的业务场景。许多企业在购买GPT账号或接入外部大模型后,仍难以将其与自身业务有效结合。这是因为AI需要与业务深度耦合,由业务来驱动。不同行业、不同企业之间的AI应用场景可能存在巨大差异,因此,企业需要根据自身业务特点来定义和引导AI的应用。
为了实现大模型在企业中的顺利落地,我们建议采取“小切口、大纵深”的策略。企业应首先邀请业务专家参与,将自身的业务需求分解为一系列具体、明确的任务和场景。然后,再将这些任务与场景与大模型已经证明具备的能力进行匹配。在匹配过程中,需要关注三个关键要素:大模型的能力是否能够在该场景中发挥作用、是否有足够的数据和知识来支持大模型的应用、以及该场景的容错率如何。
以人力资源领域为例,企业可以从多个潜在场景中挑选出几个痛点最突出、成本最高或当前表现最不佳的场景,优先尝试引入AI技术进行解决。同时,为了确保大模型的有效训练和评估,企业必须确保拥有足够的历史数据和知识积累。在容错率方面,企业也需要对AI技术在关键业务环节中的应用持谨慎态度,以确保不会对业务造成无法挽回的影响。
落地框架
大模型在企业中的落地应用需要一个全面的框架来确保有效性和安全性。这个框架主要包含以下三个部分:
首先,“数据工厂和模型工厂”的概念对于每个拥有自己大模型的企业至关重要。这意味着企业需要将一部分本地知识融入模型中,通过数据工厂和模型工厂的支持,训练出符合企业特性的大模型,以更好地适应和解决实际业务问题。
其次,外部知识库的建设也是关键。企业内部的知识不断更新,因此除了将知识融入大模型外,还需要通过外部知识库来管理和校正模型可能出现的错误。通过将知识搜索的准确性和大模型的智能性相结合,可以确保大模型在处理企业知识时不会出错,从而提高其应用的可靠性。
最后,智能体框架的引入为大模型赋予了更强大的执行能力。智能体可以理解为大模型的扩展,使其能够与企业内部的CRM、ERP、OA等系统相连接,甚至通过互联网进行交互。这样一来,大模型就不仅仅是一个对话工具,而是能够实际参与企业的业务流程,提高工作效率和智能化水平。然而,智能体的引入也带来了安全风险,因此必须重视并解决安全问题,以确保其双刃剑的特性不会对企业造成损害。
2024年大模型十大发展趋势判断
大模型普及化:大模型将成为每个企业的标配,无处不在。
开源大模型爆发:随着技术的日益成熟和开源社区的蓬勃发展,大模型的技术壁垒将逐渐消失,以更为亲民的价格走进千家万户。
小模型智能终端应用:为了适应更多智能终端的需求,小模型将应运而生,为物联网、边缘计算等领域注入新的活力。
企业级市场崛起:随着企业对智能化需求的日益增长,大模型在企业级市场的应用将迎来爆发式增长。
智能体:大模型如同强大的发动机,而智能体则是将其与实际应用相结合的底盘和轮子。
ToC场景杀手级应用涌现:在面向消费者的场景中,有望出现一批杀手级应用,引领新一轮的消费升级和生活方式变革。
多模态:随着技术的进步和应用需求的提升,多模态将在企业中逐渐普及,成为处理视频、音频等多媒体信息的标配技术。
AIGC:人工智能生成内容(AIGC)技术将取得突破性进展,从初期的图像生成逐渐拓展到视频生成等领域,为市场营销、设计等领域提供强大的辅助工具。
机器人:随着大模型技术的不断渗透和应用,机器人产业将迎来新的发展机遇,有望在未来几年内实现爆发式增长。
推动基础科学研究:大模型将逐渐成为一种强大的基础科学研究工具。
end
欢迎关注商学院人物
讲述人物故事 传递商业观点