DeepSeek的横空出世,打破了主导大模型训练与开发的大数据、强算力、高耗能标准,不仅在技术上引发人工智能软、硬件开发与应用的震荡,而且以其技术逻辑创新直指技术拥有者的权力、技术应用者的权利和技术争夺开创者的利益等重要政治问题。因此,在人工智能时代正视人工智能不同技术范式所带来的技术效应、社会效应和政治效应,既是葆有技术创新性、推进技术应用普惠性,形成技术发展良好生态的重要之事,又是直面技术定义时代改变权利逻辑,技术推进社会发展产生政治问题,技术改变生存逻辑形成全新政治生态的前提性问题。
训练消耗与技术的话语权
在技术领域,人们形成话语权的重中之重是对关键技术节点的掌控。DeepSeek利用算法机制的优化大幅降低了大模型训练与开发过程中的能源消耗,重塑了人工智能发展的技术范式,使大模型DeepSeek由“产品输出”发展到“范式输出”。因为,技术话语权的高级形态是在方法论层面进行技术范式的输出。具体而言,如若企业依靠核心技术理念的重大突破使产品优化方向成为行业基础假设,那么这一技术路线便获得了天然的合法性。
一方面,DeepSeek依靠降低训练消耗显著改善了大模型的技术效率问题,在人工智能领域掀起了软硬件开发与应用层面的重大变革。具体而言,通过算法等软件层面的技术突破,科研工作者不仅可以根据算法的需求对芯片的设计和功能进行改进,而且还可以针对芯片的计算能力、存储带宽等特点对算法进行部署与应用,从而使二者实现深度适配,有力促进人工智能软硬件垂直技术栈的构建与完善。另一方面,算力消耗的降低成为重塑技术权力结构的战略工具。因此,当大模型DeepSeek通过算法机制的优化打破“算力规模决定模型性能”的技术迷思时,实质上是通过打破依赖算力资源优势建立的传统技术壁垒,对既有权力体系的技术基础进行解构,从而为技术话语权的重构开辟了空间。由此而言,DeepSeek通过算法优化与架构创新使人工智能技术范式“实现从‘规模扩张’向‘密度跃迁’的跃升”,重构了产业价值评估体系。当其将“单位算力下的模型效能”设置为衡量大模型性能的“金标准”时,依赖算力暴力堆砌的竞品就将自动陷入价值贬损的困境。也就是说,大模型DeepSeek借助算法机制的优化,通过技术突破补偿硬件的性能差距,降低了对特定高端硬件的依赖。在应对国际技术封锁时,这种技术上的自主性具有重要的战略价值,不仅能够规避其他国家对我国的硬件限制,实现人工智能技术的持续迭代;还可以使技术突破成为支撑人工智能技术标准制定与谈判的有力筹码,在行业规则层面保障国家技术发展的长远利益。因此,DeepSeek以其训练消耗的降低,不仅强化了硬件的自主权,还在一定程度上获取了行业标准的主导权,从而实现了技术话语权的提升。
技术创新与技术的发展权
技术发展权的本质是对行业演进方向的定义权与控制权。大模型DeepSeek通过结构化稀疏、层次化稀疏与动态稀疏等相关技术,实现了注意力机制的革新,这不仅是一次算法效率的突破,更是一场关于技术发展权的深刻变革。具体来讲,DeepSeek从全局注意力机制向稀疏注意力机制的技术跃迁,通过重新定义注意力计算范式降低了大模型的计算复杂度,从而较大幅度地节省了机器系统训练与开发过程中对算力和内存的占用。
首先,稀疏化技术赋予了机器系统在有限物理资源约束的条件下实现性能跃迁的能力,以其技术效用为人工智能技术拓宽了发展路径。换句话说,大模型DeepSeek使技术路径的演进方向从硬件自主扩展到算法自主、从数据控制延伸到计算控制,由此解构了传统技术路径的刚性约束,在提升模型效率的同时,重构了人工智能技术演进的底层逻辑。其次,DeepSeek依靠模型结构的改进、数据工程的革新与训练方法的突破引发了人工智能产业链的变革,在全球化技术治理的博弈中定义了数字时代构建基础设施的规则。最后,DeepSeek通过对算力霸权的消解与重构,在一定程度上掌握了对技术发展路径的定义权。因为,传统意义上的算力霸权主要取决于硬件性能所具备的绝对领先优势,但稀疏化技术凭借其在算法层面的创新性突破,使模型性能实现了超线性的增长态势,对算力竞争格局进行了重塑,令人工智能领域的技术发展重心向算法与硬件的协同优化偏移。“技术创新既是技术问题,又是个人、企业和社会基于对物性能力充分理解与创造性设计之后所形成的全新体系与装置,还是以社会化的方式创造的全新的权力体系,它事关社会进步与国家安全。”因此,当人工智能能够通过技术创新重新定义技术范式、重构评估体系、重塑产业规则时,技术发展权的作用就超越了传统意义上的经济效益,还将深刻影响人类社会的智能化进程。
共享逻辑与技术的应用权
大模型DeepSeek以其“开源”的共享逻辑,通过解除技术应用权的部分限制,实现了人工智能的技术普惠。技术的应用权包括对技术进行使用、改进与优化等相关权利。在闭源体系中,人工智能通过加密算法、访问控制与代码混淆等方式,将机器系统的关键信息进行硬性封锁,从而满足其确保企业技术优势和竞争力等需求。DeepSeek的开源实践赋予用户更多的应用权,揭示出人工智能时代技术普惠化的复杂前景。
一方面,DeepSeek的开源模式使企业能够重新定义技术可行性的边界。高昂的研发成本、闭源的技术体系与缓慢的技术迭代速度成为大模型训练与开发难以跨越的门槛,DeepSeek通过全面开源使原本被限制的应用场景向社会群体开放,这种成本效益使企业不需要投入大量时间和资金从头开始训练大模型,而是聚焦自身需求,针对新的应用场景对现有模型进行微调,不仅以较低的资源耗费探索了人工智能技术发展与应用的潜在方向,而且还拓宽了技术可行性的边界。另一方面,DeepSeek通过开源的共享逻辑实现了对技术系统政治生态的重构。在开源生态中,技术应用权不再局限于功能的调用,而更强调机器系统的生态适应力。具体而言,传统闭源生态呈现为金字塔结构,企业掌握着核心技术,而用户群体只能被动接受服务。DeepSeek则通过开源社区,将全球开发者聚集在一起,通过社区成员之间的技术交流与协作,形成一个庞大的分布式网络,使开源社区的共享逻辑在一定程度上消解了传统技术的等级制。在这一技术演进的过程中,中小企业可以通过行使技术应用权来获取经济利益并拓展应用实践场景;学术机构可以借助开放代码和技术报告进行研究复现与理论验证;个体开发者可以凭借对机制的创新赢得社区声望。虽然这种模式目前仍具有不可忽视的客观风险,例如在商业盈利层面,算法优势可能被开源社区稀释;在技术可控性方面,模型将更为依赖外部社区的更新与维护;在技术安全层面,开源意味着系统面临更高的安全隐患。但这些风险并非对开源模式的否定,正如DeepSeek创始人梁文峰所言,“开源更像一个文化行为,而非商业行为……我们不会闭源。我们认为先有一个强大的技术生态更重要”。
(作者系华南师范大学马克思主义学院副院长、教授)