DeepSeek展现开源人工智能变革潜力

2025-03-25 来源:中国社会科学网-中国社会科学报

微信公众号

分享
链接已复制
  2025年初,由中国人工智能企业深度求索开发的开源大模型DeepSeek声名鹊起,引发海内外各界的热烈讨论。美国知名投资人马克·安德森(Marc Andreessen)称赞DeepSeek是他所见过的“最惊人、最令人印象深刻的突破之一”。许多区域研究专家认为,深度求索和其他中国人工智能企业的成功不同寻常。
  为“全球南方”数字化进程带来希望
  面对美国的技术限制,DeepSeek在自主数字化和人工智能产业发展上迈出了重要的一步,进一步挑战了美国和西方的数字霸权及其在人工智能领域的强势地位。很明显,深度求索公司以低成本优势推出的强大人工智能模型已带来显著的全球影响。与西方同行业企业相比,它采用的是开源模式,这意味着其算法开放、共享。
  一些西方政客对DeepSeek的忌惮源于竞争焦虑。DeepSeek迅速登顶各大应用商店榜首,引发美国科技股市场变动,并超越ChatGPT成为美国区苹果应用商店下载排行榜第一的免费应用,英伟达(NVIDIA)、“脸书”母公司“元”公司(Meta)和谷歌母公司“字母表”公司(Alphabet)对此表示关注。DeepSeek的问世也影响了美国能源企业,它的聊天机器人仅需消耗较少电力即可匹敌美国的顶尖人工智能系统。凭借持续、多元、现代化且富有创新性的人工智能技术的优势,DeepSeek掀起的这场变革正催生新的人工智能经济形态。
  值得一提的是,在2025年2月10日至11日于法国巴黎举行的人工智能行动峰会上,谷歌前首席执行官埃里克·施密特(Eric Schmidt)提到,西方国家需要重视开发开源人工智能模型,否则就有可能在这项尖端技术的全球竞争中落后。
  DeepSeek进一步打破了美国在技术方面和半导体、芯片等领域的保护主义壁垒,给“全球南方”未来的数字化与人工智能发展带来了希望。对发展中国家和欠发达国家来说,这是一个宝贵的礼物,可助力这些国家实现更高质量的工业化、数字化、现代化和人工智能发展。
  为全球人工智能技术进步提供启示
  由于美国持续的单方面技术遏制尤其是芯片出口限制,中国企业难以通过进口获取先进人工智能芯片,如在带宽和通信速度上大幅优于其他产品的英伟达H100芯片。在硬件受限的条件下,DeepSeek通过最小化运算浪费、最大化每个图形处理单元(GPU)的周期利用率,将计算效率推向极致,成功克服技术瓶颈。
  DeepSeek超高的性价比拓宽了人工智能的伦理边界,提升了透明度,也跨越了物理障碍。它的模型免费、开放,允许中国以外的其他开发者进行修改并从技术跃升中受益,这颠覆了人工智能领域的生态。DeepSeek的互动性、融合性、创新性、高效率、未来性和生成性使其成为社交媒体关注的焦点。这在社会、经济、政治和战略层面具有重大意义,为推动“全球南方”未来的数字化与人工智能发展提供了一个新方案。
  目前,中国已形成大规模、多层级工业优势,可在制造业等领域利用开源人工智能技术实现进一步突破,而DeepSeek将在其中扮演重要角色。显然,深度求索已成为一股新的开创性力量,促进机器学习、自然语言处理和数据分析的概念重构。这是一家有远见的人工智能企业,致力于产业革新、提升人类能力并推动全球复杂性难题的解决。
  DeepSeek还可为全球供应链整合以及进一步提升中国制造业的竞争力提供助力。制造业可借助开源人工智能模型实现智能升级,如利用机器学习优化生产流程、依靠计算机视觉提升质检效率、借助预测性维护减少设备故障,从而提高生产效率、降低生产成本,推动中国制造业向高端化、智能化方向迈进。
  可以确定的是,DeepSeek及其开源生态的成功展现了中国开源人工智能的变革潜力。目前,电信、汽车、教育、金融等行业的组织机构纷纷接入这一模型,这预示着开源人工智能有望在各领域广泛普及。
  从智能工厂到智慧医疗系统,开源人工智能正以前所未有的速度推动创新,巩固中国在全球人工智能领域的领先地位,也将惠及“全球南方”和广大发展中国家。这不仅会促进中国人工智能产业的发展,还能为全球人工智能技术进步提供启示。
  在不同领域拥有广阔应用潜力
  DeepSeek的成功建立在机器学习、自然语言处理和数据分析等先进技术的基础之上,使其能够提供卓越的人工智能解决方案。机器学习是DeepSeek能力的核心,训练算法从数据中学习并作出预测或决策。自然语言处理使机器能够理解、解读并生成人类语言,支撑聊天机器人、虚拟助手、情绪分析、语言翻译等功能,可应对语境、语法、句法等复杂的人类语言系统。计算机视觉赋予机器解读和分析视觉信息的能力,可用于图像识别、对象检测和视频分析。这些能力对医疗、自动驾驶、监控等领域非常重要。此外,深度学习作为机器学习的分支,可通过多层神经网络解决更复杂、更抽象的问题,而数据分析则帮助组织机构从海量数据中提取洞见。
  更具体地说,DeepSeek整合了以下核心技术:将模型划分为多个专业模块的混合专家架构(MoE)和通过聚焦上下文关键信息进一步减少内存占用的多头潜在注意力机制(MLA)。多头潜在注意力机制不会存储所有数据,这有助于识别最重要的信息,继而通过FP8混合精度训练进行精度优化,从而在降低内存需求的同时保持高精度。
  DeepSeek在医疗行业的应用潜力毋庸置疑,它有助于提升疾病诊断、个性化治疗方案制定及医院运营的效率。DeepSeek的计算机视觉算法有利于便捷地解析医学影像,实现疾病的早期筛查;其自然语言处理模型可从电子病历中提取关键信息,辅助临床决策。由此可见,DeepSeek将对人类健康、药物研发及制药行业产生直接影响。
  在金融领域,DeepSeek可通过人工智能驱动的聊天机器人和虚拟助手提高风险评估的准确性、识别诈骗、提升用户服务体验,而其预测性分析模型可帮助金融机构优化投资决策。这些技术将直接为银行业的未来发展带来积极影响,提升其效益。
  在零售领域,DeepSeek可通过个性化推荐、需求预测及库存管理来优化消费者体验、提升供应链效率、提高销售业绩,赋能零售商在瞬息万变的市场中保持竞争力。
  对制造业而言,DeepSeek的人工智能解决方案将通过预测性维护、质量控制及供应链优化进一步提升制造流程的效率和质量,有效降低企业成本并提高生产力。DeepSeek还将促进自动驾驶汽车、无人机及机器人自主系统的发展,计算机视觉、传感器融合及决策算法可让这些系统安全高效地完成环境感知与交互任务。
  教育也将成为DeepSeek技术的关键应用领域之一。通过个性化学习平台、行政事务自动化和增强学生参与度,DeepSeek有望培育一批智能辅导系统、自适应学习平台和自动批改工具,重塑未来教育模式。
  DeepSeek有望进一步激发并丰富中国经济发展的新动能,主要涉及电动汽车、锂电池、人工智能、绿色及可再生能源和半导体领域,期待其以实际效益助力《中国制造2025》规划的持续实施。
  尽管西方不断施压,华为、深度求索等企业坚持创新,挑战了美国的技术霸权。中国的战略性投资与支持正在重塑全球产业格局,在尖端科技领域与西方并驾齐驱。DeepSeek的成功标志着以美国硅谷为代表的风险投资驱动模式与中国制造业敏捷性的全面“相遇”,两大生态系统之间的对比进一步凸显。
  (作者系巴基斯坦中巴知识走廊论坛主席、伊斯兰堡南亚与国际研究中心执行主任)
转载请注明来源:中国社会科学网【编辑:陈禹同(报纸) 齐泽垚(网络)】