大模型赋能万行万业:生态型商业模式

2024-03-08 作者:戎珂 康正瑶 罗怡宁 来源:《中国社会科学评价》2023年第4期

微信公众号

分享
链接已复制

摘  要:ChatGPT的问世标志着大模型时代的来临。尽管人工智能的技术已经取得了巨大的突破,但产业落地和商业化一直面临挑战。如何促进大模型的产业落地、赋能万行万业,成为各界关注的焦点。以生态视角解构大模型产业,大模型产业生态可以分为四个层次:数字基础设施层(L1)、通用大模型层(L2)、行业模型层(L3)和场景模型层(L4)。基于此,构建生态型商业模式,关键在于促进不同生态成员的能力共享和能力组合,核心能力和专有能力的灵活组合将带动大模型赋能万行万业,构建未来的共享经济。

关键词:大模型;人工智能;生态型商业模式

作者戎珂,清华大学社会科学学院教授(北京100084);康正瑶,布里斯托大学商学院助理教授;罗怡宁,浙江大学管理学院研究员(杭州310058 )。

  

  引言

  随着ChatGPT的问世和在全球范围的爆火,大模型正在逐渐成为引领技术和产业革命的新兴力量。大模型(Large Model),又称为基础模型(Foundation Model)或通用模型(General Model),属于一种相对较大的人工智能预训练模型。这些大模型采用迁移学习的方法,首先在大规模的公开数据集上进行训练,利用深度神经网络构建出AI模型,随后这些预训练模型可被迁移到目标场景进行微调,并实现应用创造价值。

  从发展历程来看,人工智能的演化已经历经了三个阶段,但是在商业化和产业落地方面似乎一直面临着问题,可以说历经了三次挫折。1956年夏,在美国达特茅斯大学召开了一次关于机器智能的学术研讨会,会上正式采用了“人工智能”这一术语。尽管人工神经网络的概念可以追溯到20世纪40年代和50年代,但在发展早期由于算力算法等条件都不成熟,这一时期的探索停留在理论阶段。20世纪70年代起,人工智能发展进入第二阶段,第五代计算机的问世带来了算力和算法的进步,但是数据成了主要的障碍,因为不足以计算和积累海量数据,此时与人工智能技术的商业化也有较大距离。直到21世纪第二个十年,人工智能技术才迎来了新一轮发展,这一变革主要得益于硬件技术的进步(如GPU)、算法的优化和大规模数据集的可用性。人工神经网络的演进和深度学习的崛起代表着人工智能领域的重大转变。深度学习作为人工智能的一个子领域,强调训练多层次的深度神经网络。这一技术的兴起为大模型的发展铺平了道路,并成为当今人工智能领域的重要支柱之一。但是目前看来,在商业化方面,由于应用场景和行业知识缺乏的问题,这一阶段人工智能仍未实现大规模商业化运用,也成为亟待解决的问题。

  大模型标志着人工智能发展的一个新阶段。迁移学习作为与大模型相关的关键概念之一,引领了人工智能的新浪潮。在2017年Vaswani等人的论文中,Transformer架构的提出彻底改变了自然语言处理领域的范式。如BERT和GPT等大模型在自然语言处理领域的卓越表现便是迁移学习的杰出示范。虽然BERT模型在2018年就已推出,模型参数量达到3亿,但这种模型并未像GPT一样大获成功,这涉及算据的重要性。BERT采用的是自监督预训练的模式,而GPT大模型是基于人类反馈的强化学习技术,海量的训练数据为GPT的成功奠定了基础。目前,以GPT系模型为代表的大语言模型(LLM,Large Language Model)是现有大模型的主要组成部分。大规模图像数据集,如ImageNet的出现也为图像预训练大模型提供了数据基础。各类大模型的涌现已经改变了文本、图像和音频内容的生成方式,人工智能生成内容(AIGC,Artificial intelligence generated content)引起了广泛关注,展示了大模型在应用领域的巨大潜力。

  从大模型的发展历程可以看出,尽管起步很早新技术不断涌现,大模型的发展仍历经挫折,特别是商业化应用和应用场景落地困难重重,这是因为前期算力、算法、算据等条件还不成熟,而目前也需要进一步寻找和探索应用场景,解决具体应用场景的问题,创造实际价值真正赋能万行万业。展望未来,尽管大模型的前景光明,但仍面临着一系列的技术挑战,包括计算资源、数据偏见和模型解释性等问题,更需要解决长期以来在商业化落地方面的障碍。在用户端掀起浪潮后,大模型将如何进一步赋能产业,实现商业化落地,带来万行万业的升级与革命?在这个充满机遇和挑战的背景下,本文将聚焦大模型如何商业化这一研究问题,探讨大模型的定义、发展现状以及商业化应用的发展机遇。

  大模型的产业化落地和商业化应用需要培育生态型商业模式,构建大模型产业生态体系。本文首先将大模型产业生态分解为四个层次,包括数字基础设施层(L1)、通用大模型层(L2)、行业模型层(L3)和场景模型层(L4)。在这四个层次中,数字基础设施提供了大模型训练和推理所需的基础设施,通用大模型为各行各业的应用提供了通用性的基础构建模块,行业模型通过融合特定行业的数据和特征,提供了更专业化的大模型,而场景模型则进一步细分,专注于解决特定场景或问题的需求。

  基于此,本文提出了生态型商业模式的关键概念。与传统商业模式不同,生态型商业模式由更广泛的生态成员组成,包括通用平台和多元的生态伙伴。生态型商业模式强调能力共享和能力组合,企业不再仅提供单一的产品和服务,而是根据自身优势和禀赋,培育和提供不同侧重的能力,并通过能力的灵活组合以满足各种不同场景的需求。在大模型产业生态中,各级别的生态成员,包括政府、行业协会、数字企业、各行业龙头企业和中小企业等,共同参与,协同合作,构建一个具有开放性和创新性的生态系统,推动大模型在各行各业的应用和发展。本文将探讨如何通过培育生态型商业模式和构建大模型产业生态体系,将大模型的力量充分落地于各行各业,推动全面的数字化转型和智能化发展。

  一、大模型发展的机遇和挑战

  大模型的发展受到多个关键因素的影响,这些因素既提供了机遇,也带来了挑战。

  在算法方面,大模型的发展取得了显著进展,这为各种任务的高效训练和部署提供了新的机遇。新的深度学习架构和优化技术不断涌现,如Transformer架构的提出,极大地推动了自然语言处理任务的发展。这些新算法使得大模型在各个领域中的发展取得了重大的突破,使大模型更加智能。然而,其也带来了进一步的挑战。大模型在运用到各类多元化的应用场景的过程中,需要面向该领域的算法人才的补充和算法技术的进步。为了实现卓越性能,大模型需要更海量的数据和更复杂、精细的算法,实现不断优化迭代。这意味着需要进行更多的专业研究来改进训练算法,同时也需要更多的标注数据,要求持续的大投入、高成本,这对于许多企业来说将成为最大的制约因素之一,特别是资源相对缺乏的中小企业。

  从算力角度,硬件算力的提升是大模型发展的另一个关键机遇。GPU和TPU等硬件技术的进步使得大模型的训练时间大幅缩短,同时也使模型规模和性能不断提高。硬件的进步极大地赋能了算法的研究和突破,为算法开发提供了更多的灵活性和创新空间。然而,算力方面也面临着巨大的挑战。解决许多复杂问题要求极大的算力,只有少数大型组织和研究机构能够承担这些高昂的算力成本。此外,大规模的算力使用也引发了能源消耗和环境问题,引起了越来越大的社会争议,未来的人工智能解决方案需要将能源高效作为发展目标之一。

  在算据方面,海量数据是大模型发展的关键要素之一。互联网上积累的大量数据为大模型的训练带来了巨大的机遇,包括文本、图像、音频、视频等多种形式的数据为多领域的任务提供了训练的基础。然而,算据的积累需要大量的标注工作,特别是高质量算据往往需要企业投入大量成本、雇佣专业团队进行标注,比如OpenAI对GPT模型的训练就投入了普通企业难以负担的成本,因此高质量算据缺乏也将成为大模型普及的瓶颈之一。另外,数据的质量和隐私问题一直是一个饱受争议的话题,目前仍缺乏统一标准,一定程度上将阻碍大模型未来的规范健康发展。同时,不同于互联网数据,许多领域的可用数据可能非常有限,难以训练出高性能的大模型。在未来的发展中,数据分类、数据采集、数据管理和数据安全保障等环节对于大模型的发展都至关重要。

  从算知角度,知识的积累和传递对于大模型的迅速发展至关重要。比如开源社区和研究机构的开放分享对于大模型的普及和推广起到了重要的作用,也促进了可持续的创新。然而,未来大模型的发展对于算知的要求将更加精细、更加复杂,这带来了较大的挑战。要将大模型应用到各行各业,不仅需要人工智能的能力,还需要结合各个领域高度专业化的产业知识,如何将二者融合、落地产业应用将成为未来算知发展的重要挑战。与此同时,人工智能的进步与发展也产生了新的伦理问题,大模型带来的知识共享和传递也引发了一些知识产权和安全方面的问题,这些都需要进一步探讨和规制管理。

  最后,大模型在经济社会层面的影响也意味着大量的机遇和挑战。大模型的发展不仅仅涉及技术问题,还会产生广泛而深远的社会影响。首先,大模型的大量计算需求导致高能耗和碳排放问题,未来需要寻找更为可持续性的人工智能解决方案,以减轻其对环境的负面影响。其次,随着大模型的力量愈发强大,其使用也引发了伦理担忧,包括生成虚假内容、深度伪造(Deepfake)技术的滥用、误导信息传播等,这些都需要社会共同努力来解决。

  二、大模型产业的生态层次

  目前大模型的发展已经给产业变革和生产力的提高带来了新的机遇,但是我们也可以看到,目前大模型的应用落地情况并不乐观,处于一个分散探索的状态,缺乏整体体系。如何将大模型的力量更紧密地和万行万业的产业落地相结合?本文提出,各方需要应用生态培育思维,联合多层次生态伙伴,构建生态型商业模式,共同打造大模型产业生态体系。

  本文认为,大模型产业生态的生态层次可以解构为四层,如下图所示,包括L1数字基础设施层、L2通用大模型层、L3行业模型层、L4场景模型层。

  (一)L1:数字基础设施层

  数字基础设施是以数据创新为驱动、通信网络为基础、数据算力设施为核心的基础设施体系。数字基础设施层包括“硬软云网”等主要组成部分,比如数字硬件(主要包括CPU、GPU、智能芯片)、数字软件(主要包括数据库、中间件和操作系统)、数字云服务/计算和数字网络设施(指5G和工业互联网)。数字基础设施是数字经济和生活发展的基石, 也是大模型产业发展的重要底座。大模型的训练需要高算力的支持、更专业的软件工具和算法框架,云计算为大模型的发展提供了更弹性的计算资源,高性能网络基础设施则确保了快速的数据传输和模型推理,5G技术的发展将进一步改善移动应用中大模型的性能。因此,数字基础设施层是大模型产业生态不可或缺的一个层次。

  (二)L2:通用大模型层

  通用大模型是指那些能够提供最基础、最底层的人工智能能力的模型,它们在多个行业和场景中都具有广泛的通用性。通用大模型具有多种基础的核心AI能力,包括自然语言理解、图像识别、语音识别和处理等,可以类比为一个人的基础五感,提供了大模型产业发展的基础构建模块,这种底层通用能力为进一步在各行各业的应用提供了坚实的基础。

  通用大模型往往对算力、算法、算据都具有很高的要求。通用大模型的性能通常受到大规模数据集的训练和精细调整的影响, 它们需要从广泛且海量的数据中学习,提炼出通用能力。并且,通用大模型往往需要不断地迭代和升级,以适应不断变化的需求和技术进展。以GPT系大语言模型为例,GPT系一直在不断进化。在参数规模上,GPT-4将拥有超过1.76万亿个参数,而GPT-3只有1750亿个参数;在模型能力上,GPT-3.5主要提供文本理解、文本生成、逻辑推理等能力,但只能接受文本作为输入,并输出文本,而GPT-4进化成了一个多模态(multimodal)模型,即它可以接受图像信息,可以处理更复杂且具有视觉信息的任务,如图像描述、图像问答、图像转文本等能力。通用大模型大大降低了许多企业和开发团队采用人工智能的难度,他们不再需要从零开始构建一个大模型,这大大节省了时间和资源,并使更多的组织能够基于通用大模型的能力应用到细分领域,以加速创新和解决问题,比如基于GPT-3.5和GPT-4架构,OpenAI推出ChatGPT这一人工智能聊天机器人应用,其高交互性使其能够快速推广、风靡全球。

  国内通用大模型的发展也如火如荼。我国互联网科技巨头公司包括百度、腾讯、华为、阿里都已经纷纷推出通用大模型体系。比如百度的文心大模型体系中包括NLP(自然语言处理)大模型、CV(机器视觉)大模型和跨模态大模型等多种类基础性的通用大模型,提供了全面的通用能力。阿里巴巴的 “通义”大模型体系中,作为底座的通用统一大模型M6OFA模型具备处理多种任务的通用能力,囊括了针对图像、文本、语音、动作等多种跨模态任务。同样地,2023年9月,腾讯在 2023 腾讯全球数字生态大会上发布了“混元”大模型,协同了腾讯预训练研发力量,完整覆盖NLP大模型、 CV大模型、跨模态大模型。华为也发布了“盘古大模型”,包括五个基础大模型——自然语言大模型、视觉大模型、多模态大模型、预测大模型和科学计算大模型,能力覆盖了对话问答、文案生成、图像生成、图像理解、科学计算等。其他通用大模型的例子包括IDEA研究院推出的姜子牙(Ziya)通用大模型、科大讯飞的星火大模型等。从这些案例中可以看到,通用大模型成为目前主流大模型体系中不可或缺的一个层次。

  (三)L3:行业模型层

  行业模型层,是在通用大模型基础上的进一步演进,它在通用AI能力的基础上,通过融合各行业的具体数据和行业特征,构建出更专业化、定制化的大模型,以满足特定行业需求。行业大模型具有以下三点特征:第一,行业数据驱动:L3行业模型层的核心特征是它们以行业数据为驱动,利用各行业特有的专业数据,比如金融领域的交易数据、医疗领域的健康记录或制造业的传感器数据等。这些数据是理解特定行业的基础,有助于提高模型在各行业的契合度和可应用程度。第二,行业特征融合:在L3层,行业大模型从行业数据中提炼行业特征,并开发面向特定数据的特定算法,比如法规法律、行业标准、商业流程等,与特定行业的运作方式密切相关。通过融合这些特征,行业大模型可以更好地理解和适应特定行业的环境和要求。第三,面向行业需求:L3行业模型层的设计目标是满足行业需求,通过针对行业特定需求进行不断优化和训练,从而得以解决特定行业的挑战和问题,例如,医疗行业的大模型可以解决疾病诊断和药物研发,而在金融行业,它们可以用于风险评估和投资建议。

  行业大模型往往需要根据不同行业内的企业或组织的需求进行调整,以提供定制化的解决方案,并且也根据行业的演变和新数据的涌现而不断优化,以保持与行业发展的同步。行业大模型代表了通用大模型向更具定制性和行业导向性的演进,这些模型的出现将为各行业带来更多的智能应用,帮助解决行业内的复杂问题,并推动各行业的数字化转型。因此,行业大模型往往需要各行业的企业的参与,融入该行业的特定数据、知识和需求。

  例如,在交通行业的应用中,通用大模型发挥了关键作用,充分利用其自然语言处理、机器视觉以及计算推理等多重能力,为解决复杂的交通问题、推动智能驾驶的发展提供了有力的支持。交通领域的数据具有多样化、复杂化的特征,包括文本数据、语言数据、传感器数据、摄像头视频等多种类型的数据,通用大模型可以更高效、更协同地处理这些数据,比如,自然语言处理技术可以用于交通报告的分析,实现对大量交通事件和事故报告的自动处理和分析;计算机视觉技术在自动驾驶中的车道线、红绿灯、行人等图像的识别方面发挥关键作用;计算推理能力则应用于路况预测、路线规划、事件反应等任务中。利用通用大模型提供的基础能力,交通行业大模型将成为未来智能交通发展的强大工具,通过充分利用这些模型,交通行业可以更好地应对复杂性和变化性,推动智能驾驶技术的发展,提高交通系统的效率和安全性。目前,国内已经推出了数个交通行业大模型。比如百度ACE智能交通引擎30大模型,聚合和泛化了车辆、道路、云计算和地图数据等多个交通行业的关键要素,提供交通大脑大模型、全域信控大模型、智慧高速大模型等多种智能交通能力,具有超过百亿参数。另一个例子是华为的盘古汽车大模型,应用于汽车制造和研发过程中的多个方面,包括汽车设计的辅助、性能优化、自动驾驶系统的开发和测试等。

  华为盘古大模型另一个典型的行业应用是盘古矿山大模型。该模型由华为与行业内龙头企业山东能源和云鼎科技共同开发,华为提供通用大模型的底层基础能力,行业龙头山东能源和云鼎科技则提供矿山行业的专有知识和能力,目前盘古矿山大模型具有百亿参数、十亿数据,为矿山行业的智能转型提供了极大的助力。

  (四)L4:场景模型层

  场景模型层是各行业大模型下的进一步细分化、专业化的大模型,它们专注于满足特定行业内某个具体场景或问题的需求,并结合特定数据和专业算法来构建。这一级别的模型在行业大模型的基础上进一步精细化,以提供更具体的解决方案。场景模型层的特点包括:第一,问题定制。场景模型旨在解决特定场景或问题,因此它们的设计和训练更加精细化,以满足特殊需求。第二,数据特定。它们结合了特定场景中的数据,这些数据包括更明确的传感器数据、图像、文本等,以支持在特定场景下的应用。第三,算法专业。场景模型需要面向每个场景的要求,开发特定的算法和技术,以应对多个场景带来的复杂性。

  总之,场景模型是行业模型的进一步定制化,它们旨在满足特定场景或问题的需求,即使在同一行业中,由于场景特点和需求差异较大,场景大模型也需要面向这些差异,提供具体的解决方案。比如,以交通行业自动驾驶为例,不同场景的需求以及对应场景大模型的侧重点是非常不同的。例如在封闭、限定区域内的物品运输场景,如港口或工业园区的运货,通常具有固定的路线,车速较低,不受交通规则限制,可商用化的程度较高,对于货物运输的效率和成本较为看重。因此在这一场景下,大模型的关注点不仅包括驾驶安全性,也非常关注高效率和成本优化,比如如何优化货物装载方式,确保最大化载货量,规划最经济的路线,减少运输时间、燃料消耗和总体运输成本。而在一些载人场景下,比如自动驾驶出租车Robotaxi场景,城市交通、各种天气条件以及人类司机行为等多种因素给汽车的驾驶带来了极大的复杂性和不确定性,这种场景要求大模型能够高度适应多变的路况和不可预测的情况。在这种情况下,保证安全性是绝对的首要任务,针对这一场景的大模型需要强大的感知和决策能力,以确保高度安全的自动驾驶,模型必须能够高度准确地识别并响应交通信号、其他车辆、行人以及各种道路条件,应对各类突发情况。

  在上文提到的矿山行业大模型中,也涉及许多不同的场景。比如华为盘古矿山大模型已经覆盖了采煤、掘进、主运、辅运、提升、安监、防冲、洗选、焦化 9 个专业 21 个场景应用,每个场景模型的侧重点也各具差异。比如主运输系统在矿山中充当着贯穿整个矿山的“高速公路”角色,主运场景通常需要高效的运输和监测,因此在主运场景中,AI大模型主要侧重于智能识别能力,它能够代替人工巡检,实现全时段智能监测,精准识别异物和异常情况。这有助于保障主运系统的安全高效运行,降低了人工巡检的成本和风险。同时,掘进是矿山中的一项关键作业,涉及钻眼深度、搅拌时间等作业规范的严格控制,对井下人员的作业安全至关重要。因此在掘进场景中,大模型需要提供精准的监测能力,以确保各类作业符合规范,避免操作错误和潜在的危险情况,最大限度地保障井下人员的作业安全。

  以上四个生态层次共同构筑了大模型产业生态。要构建全面的大模型竞争力,每个生态层次都不可或缺。各国也参与到了大模型生态的竞争中,其中从发布数量看,美国和中国处于领先地位。截至2023年7月,美国共计发布114个大模型,我国发布数量迅猛提升,累计发布130个大模型。但我国大模型生态发展处于整体多而不强的状态,理论架构、算法、技术路径主要依赖国外。在L1和L2层,美国提出了大模型发展的主流技术架构,包括神经元数学模型、谷歌知识图谱、自然语言的词向量化、联邦学习、Transformer架构;谷歌与微软的通用大模型能力在全球大模型发展中处于绝对引领地位,在我国只有百度、华为、商汤等大企业进行了大模型底层框架的自主研发,部分国产大模型只是基于国外开源大模型进行训练、微调。在L3和L4层,国外多为企业通过以API接口或相关插件的方式调用主流企业的大模型,形成了以谷歌、微软、Meta为核心的大模型生态体系,国内则百花齐放,多个行业竞相探索大模型带来的机遇。因此,未来我国大模型产业生态的建设需要扬长补短,在L1和L2层实现突破创新,在L3和L4层发挥我国产业优势,促进大模型赋能万行万业。

  三、生态型商业模式

  大模型产业生态的生态层次体现了生态型商业模式的思维。生态型商业模式(ecosystem business model, EMB)指由多样化的成员组成,整合多种不同的商业模式的综合性商业模式,这些成员构成了一个商业生态系统,并不断进行演化。传统的商业模式通常围绕特定产品和服务展开,往往关注单个企业或者组织如何创造价值和获取价值。现有对商业模式的研究主要从战略和创新两个视角进行分析。其中,战略视角强调了能力在商业模式中的重要性,包括动态能力(dynamic capability)、 适应能力(adaptability)等。创新视角则提出,商业模式对于企业创新发挥了关键作用,企业通过对商业模式进行调整、改造、升级,不断适应外部和内部对创新的要求,比如开放式创新(open innovation)。生态型商业模式的概念将重构传统商业模式以单个企业或组织为研究单位、“单打独斗”的模式,纳入多样化的生态伙伴,将对现有的两个研究视角提供新的启示。从战略视角来看,生态型商业模式强调多个成员的价值共创,不再只关注单个组织的能力,而强调多成员、多能力的培育和互动。从创新视角来看,生态型商业模式将更加突出协同创新的重要性。

  一个生态型商业模式需要通用平台和生态伙伴两部分成员的共同参与。在大模型产业生态中,通用平台由L1数字基础设施层和L2通用大模型层这两层承担,它们以平台的形式向外开放,对接广泛的、来自各行各业的生态伙伴,拓展千行百业的应用场景,从而构建L3行业模型层和L4场景模型层,推动大模型在各行各业的赋能。通用平台需要提供强大可靠的数字基础设施和基础人工智能模块,因此通常需要数字实力强的大组织或大企业承担。与此同时,还需要引入各行各业的生态伙伴,这些生态伙伴可以是各个行业的龙头企业,也可以是深耕细分领域的中小企业,还包括各类行业协会、科研机构等。有了通用平台作为支持,生态伙伴不再需要投入大量的成本开发底层大模型,只需要结合自身所在行业和场景的特定数据与需求进行微调,开发专业化的行业和场景大模型。

  大模型产业生态的建设不能是“孤军奋战”,需要多方成员的合作、协同和共享,包括政府、行业协会、数字企业、各行业龙头企业、中小企业等。政府需要提供数字基础设施底座,并引导、监管各层次成员的互动和协同,以促进产业的规范健康发展。行业协会和企业需要协同制定研发计划和标准,促进各行业的标准化,推动行业的合作和创新,特别是行业龙头企业需要发挥引领作用。同时,要有开放的生态融合思维,培育多元领域、各类规模的生态伙伴,在各行各业开拓创新的生态应用场景,整合其专有能力,推动L3层和L4层的繁荣发展。

  生态型商业模式的关键点在于能力共享和能力组合。这意味着企业不再像过去那样提供特定产品和服务,而需要培育自身的独特能力,并对外开放和贡献,不断和生态伙伴的能力进行组合,从而创造出面向不同场景的解决方案,灵活适应多样化场景的需求。生态型商业模式具有强大的拓展和创新能力,可以通过不断组合和优化能力,适应不同行业和场景的需求,促进多方共赢。生态型商业模式中的通用平台提供核心能力(core capabilities),比如在大模型生态中,硬软云网等数字基础设施是大模型产业发展的基础底座,通用的自然语言处理、机器视觉、多模态、科学计算等能力是构建大模型的必要关键模块,这些能力是一切产业应用的核心基础。与此同时,为了促进大模型能力在各行业各场景的应用,还需要各个细分行业和场景的专业技术、知识与经验,各行各业的生态伙伴提供了这样的专有能力(specific capabilities)。比如,金融机构可以结合市场数据和对市场的洞察,开发市场预测大模型;医院可以基于大量临床诊断数据和专业知识,开发智能问诊大模型;矿企可以利用各类传感器数据和在制造业深耕的经验,训练检测大模型,解决矿区的安全问题;货运公司可以结合通用大模型的机器视觉等能力,训练符合自身场景需求的自动驾驶模型。这样将通用平台的核心能力与生态伙伴的专有能力进行组合,可以形成一个个面向细分需求的商业模式,最终以生态型商业模式的范式赋能万行万业。

  生态内各成员和不同生态层次之间的能力组合将带来极大的互补和协同效应,一个良性互动的体系得以构建,实现动态的“能力叠加迭代”体系。对于来自各行各业的生态伙伴来说,它们不再需要耗费巨大的投资去搭建基础设施、从零开始训练大模型,只需要调用通用平台提供的核心能力,比如云计算能力、某个通用大模型的API,就可以开始训练自己的大模型,创新门槛大大降低。而那些通用大平台往往具有很强的数字能力,但是对各个行业缺乏了解,难以将这些核心能力落地应用到各个角落,通过开放核心能力、与生态伙伴共创,也补齐了这些企业缺乏行业深耕的短板,使其优势得到了充分发挥。实际上,生态型商业模式实现了能力的共享,大模型产业也将成为未来最大的共享经济,赋能万行万业。

  结语

  以生态型商业模式的思维促进大模型产业生态培育,将进一步助推各行各业的数字化转型。通用大模型的核心能力为企业和组织提供了更好的数字基础能力,支持更高效的数据分析和决策支持,帮助提高生产效率和服务质量,有助于各行各业的企业不断培育、提炼专有能力,加速大模型生态能力体系的建设。大模型生态的崛起也将促使工业互联网和消费互联网的深化发展,在工业领域,大模型用于监控和优化生产过程,实现智能制造;在消费领域,人工智能在个性化推荐和服务改进上的强大能力将有助于提升用户体验,并反馈给生产端,从而实现全场景的数字化和智能化。

  与此同时,培育和建设大模型产业生态仍然面临着诸多挑战。第一,在标准统一和市场管理方面,大模型产业目前正处于兴起阶段,其多样性和快速发展给标准化和市场管理带来了极大的复杂性。因此,需尽快推动大模型生态的建设,促进生态各成员协同利益,共同推进统一标准的制定,包括技术标准、产业标准、市场标准等多个方面,以提升技术上的兼容性和协同性,同时保证市场的公平竞争和健康发展。第二,在数据市场建立和管理方面也面临着挑战。人工智能大模型的发展和海量数据是不可分离的关系,通用大模型的训练需要海量数据,行业和场景大模型的构建也需要各行各业的特定数据,数据市场的建立、促进数据高效流通对于大模型生态的培育至关重要。同时,管理数据的隐私和安全也是一个重要问题,需要适当的法规和技术解决方案。我国已经推出了一系列举措,促进数据要素市场体系建立,未来需要政府引导、多方共同探讨更完善的制度。第三,产权问题也是大模型产业发展不可避免的问题。大模型的知识产权问题变得十分复杂,也引起了越来越多的争议和讨论,谁拥有和控制这些模型,以及如何分享和许可它们的使用和产出,都需要明确定义,这也再次强调了引入广泛生态成员、促进生态系统发展的重要性。

  总之,大模型的时代已经来临,通过培育生态、促进合作和创新,大模型将成为科技进步和经济发展的引擎,推动各个领域的变革和发展,不仅有助于促进数字化、革新生产力,还有助于为诸多全球性挑战如气候变化、能源革命、医疗创新等带来新的机遇。因此,各行各业应积极利用和发挥大模型的能力,构建生态型商业模式,加速大模型的商业化落地和广泛创新,打造未来最大的共享经济,迎接新时代的机遇和挑战。

  〔本文注释内容略〕

  原文责任编辑:梁华

转载请注明来源:中国社会科学网【编辑:常畅】