大语言模型与国家安全的关联

2025-02-13 来源:中国社会科学网-中国社会科学报

微信公众号

分享
链接已复制
  关于大语言模型与国家安全的关联,社会的认知度因地区、领域和专业背景而异。我们需要在理论与技术的基础层面提高对大语言模型的认知度,促进各行业的跨学科合作,让相关内容进入高校教学内容,推进相应的教学改革,使大语言模型与国家安全问题上升为国民意识,成为当下国家治理中的重要课题。
  大语言模型对国家安全的重要性
  用于自然语言处理和情报分析的技术在国际安全领域中发挥着重要作用,这些技术具有强大的语言处理能力,可以收集和分析情报、识别潜在威胁、进行情感分析、加速文本分类、翻译文字并生成文本,从而极大地提升工作效率。当前,主要有四类关键技术在该领域得到广泛应用。首先是由OpenAI开发的GPT系列。这是基于Transformer架构的大型语言模型,涵盖了GPT-2、GPT-3、GPT-4等多个版本,通过增强的预训练和微调策略进行推理、翻译并生成文本,版本越高,处理复杂任务的能力越强。其次是Google推出的BERT模型。这是一种双向预训练模型,能够通过上下文语境捕捉更精确的语义理解,广泛应用于问答系统和句子分类等任务。再次是Google的XLNet。它结合了自回归和自编码的技术,通过改进预训练方法进一步提高了模型的性能,在语言建模、文本分类和序列标注任务中表现出色。XLNet突破了BERT的双向限制,能更好地捕捉词序列中的长程依赖关系。最后是由Facebook AI研究团队推出的RoBERTa。它是BERT的改进版本,通过优化训练策略、增加数据量和调整超参数,显著提升了文本分类、句子对匹配和实体识别的能力,这些技术的应用范围涵盖了多个安全领域。近日,我国的DeepSeek崛起,减少了对外依赖,更能保障技术安全。
  在情报分析方面,大语言模型通过分析社交媒体、新闻报道和论坛信息,能够预测社会动态,判断舆情走势,进而对突发事件进行风险管控与应急处理,并且能够将语音数据转换成文本,帮助情报机构分析信息,从而监控潜在的安全威胁。通过文本分类和实体识别技术,大语言模型能够快速筛选和识别关键信息,如人物、组织和地点等,进而推断出潜在威胁,有效监控恐怖分子的活动。
  在网络安全领域,大语言模型可以检测恶意软件、网络钓鱼等网络攻击行为。通过分析网络流量和文本数据,模型能够识别异常行为和潜在漏洞,检测恶意软件,分析病毒代码、说明文档和网络论坛上的讨论,发现新型病毒变种,从而提供网络威胁的情报。模型能在网络中识别含有欺诈信息的电子邮件与社交媒体帖子等内容,协助安全团队采取防御措施,避免用户受骗。模型还可以帮助安全团队监控网络上的黑客活动,分析黑客之间的通信,及时获取其攻击技术的情报以增强网络防御能力。 
  大语言模型在国际救援和灾难应对中也发挥了重要作用,通过翻译在不同语言之间实现高效的沟通,从而促进国际间的合作。在面对自然灾害或社会冲突时,模型通过翻译、信息分析和舆情发布等手段,帮助国家应对可能的安全风险。通过处理多源数据和优化资源配置,模型能够为灾害预警、风险评估、资源分配等决策提供实时、智能化的支持,从而提升国家在应对危机时的效率。
  大语言模型在国际交流与外交工作中同样具有重要价值,能够提供实时翻译服务,极大地提高外交效率。模型还可以生成外交声明、合作协议等正式文档,为外交工作提供智能支持。通过分析大量的国际新闻和外交文件,模型能够帮助政府部门了解国际形势和他国立场,为决策提供必要的信息支持。
  大语言模型正在国家安全领域得到应用与实践。一些国家已经将大语言模型应用于国家安全,比如,瑞典为主权安全正主导开发覆盖北欧地区主要语言的大型语言模型。中国移动的“九天自然语言交互大模型”已经正式对外提供生成式人工智能服务。运营商以原创的体系化人工智能技术为核心,依托复杂系统智能化的技术积累,自主创新了模型数据构建、预训练、微调和推理等全链路核心技术。“九天自然语言交互大模型”支持全栈国产化,安全可靠,可增强行业能力。国内多省分公司使用了该大语言模型,在应对涉政暴恐与信息安全方面都有突破。基于该模型,有的省应用了新闻公文AI智慧风控功能,强化了对涉密内容的审核,为防止网络攻击还开发了威胁情报共享功能。有的省利用能力中台,构建了安全防护支撑平台,以加强数据资产的安全保障。有的省构建了多模态网络安全服务系统,为运营商全网提供了全面的网络安全漏扫服务,显著提高了全网的安全防护水平。利用网络安全机器人、可验证漏洞检测和攻击诱捕与溯源等功能,打造基础网络安全服务体系,构建端到端的安全运营体系,提供从数据到应用的有效安全防护工具。高速网络安全漏洞扫描技术显著提升了超大规模网络安全漏洞扫描效率,基于深度学习的网络威胁智能识别技术有效缩短了网络攻击特征的识别时长。目前,多模态网络安全服务系统已应用于运营商全网暴露面安全检测中,提供了全面的安全服务,包括安全漏扫、安全防护等,取得了显著的应用成效,为全网的安全运行提供了有力支持。
  应用风险与应对
  大语言模型对国家安全可能存在一些风险。在利用大语言模型进行情报分析和威胁识别时,信息的利用与管理也存在安全问题。如果数据的加密存储和传输、访问权限、管理机制出现漏洞,本身是很大的威胁,必须有高度的技术保障,要有相关各级保密法规并严格遵守。尽管模型具有强大的自然语言处理能力,但也可能发生误判,因此必须评估风险,并采取相应的防范措施。模型在收集和分析大量文本数据时,个人隐私及数据可能被泄露,因而必须避免滥用数据。不同国家法律与政策不同,文化存在差异,国际合作和信息共享可能因此出现分歧。针对以上挑战,有学者提出了协同治理的思路,可以完善数据分类、分级制度;在技术方面,应加强审查和数据清洗责任;用户则应提升辨别能力;行业组织可发布技术指南,促进规范性建设;智能伦理和法规必须加强,提升公众素养,杜绝片面技术观。
  另外,需要深入了解大语言模型的意识形态特征,加强对其意识形态倾向的辨识。模型本身并没有意识形态倾向,但它的应用可能会受到意识形态的影响,用什么样的语料对其进行训练,它就产生相应的倾向性。意识形态作为关于世界、社会和价值观的观念体系或思想信仰,可以影响到人们的认知、言论和行为,进而被用于产生、传播和强化特定意识形态的信息。使用者的动机和目的决定了信息筛选和操纵、言论管控和审查、舆论引导和意识形态输出,如果出于恶意,也会利用大语言模型进行反意识形态活动。
  大语言模型在社会生活中的影响会越来越明显,因而在教学中囊括相关内容的必要性就越来越高。在教学内容上要向学生介绍大语言模型的基本原理、发展历程以及在国家安全领域中的应用。要引入真实案例和模拟场景,引导学生探讨大语言模型在国家安全领域中所涉及的伦理和法律问题,如隐私保护、信息安全、数据管理等,培养他们的法律意识和道德责任感。真正做到这些,就要做到跨学科整合:将大语言模型与国家安全内容融入相关学科的教学中,如信息技术、法律、政治学、国际关系等,促进学生跨学科的综合理解和应用能力。
  (作者系福建师范大学外国语学院教授)
转载请注明来源:中国社会科学网【编辑:项江涛(报纸) 齐泽垚(网络)】