智能语言服务是指利用人工智能(AI)和自然语言处理(NLP)技术提供语言相关服务,其通常包括机器翻译、自然语言处理、语音识别与生成、图像处理与生成、信息抽取、文本情感分析、内容创作、AI大语言模型等。这些服务能够模拟人类对语言的理解和生成能力,以智能的方式处理和生成语言内容。智能语言服务根据技术类型可分为机器翻译、自动语音识别、自然语言处理等技术;根据应用场景可分为智能翻译、智能客服、智能语音助手等;根据服务对象可分为个人服务和企业服务,个人服务如个人智能翻译机、手机应答软件等,企业服务如企业机器翻译平台等;根据服务形态可分为在线服务和离线服务,在线服务如在线翻译网站、实时语音翻译等,离线服务如离线翻译器、语音识别软件等。
我国高度重视语言服务产业的发展,先后出台了多项政策支持人工智能语言技术开发和应用。《“互联网+”人工智能三年行动实施方案》提出,加快计算机听觉、生物特征识别、复杂环境识别、新型人机交互、自然语言处理、机器翻译等应用技术的研发和产业化。《新一代人工智能发展计划》明确提出,推进人类与机器的有效沟通和自由交互,实现多风格、多语言、多领域的自然语言智能理解和自动生成,着力研究短文本的计算分析技术,跨语言文本挖掘技术和面向机器认知智能的语义理解技术、多媒体信息理解的人机对话系统。《新一代人工智能产业创新重点任务揭榜工作方案》提出,大力构建行业训练资源库,在工业、医疗、金融、交通等领域汇集一定规模的行业应用数据,用于支持创业创新。《鼓励外商投资产业目录(2022年版)》首次将“语言服务产业”列入第460条,明确包括翻译、本地化服务、语言技术开发应用、语言资源服务等。《产业结构调整指导目录(2023年本)》在第一类鼓励类产业中首次增加翻译、本地化服务、语言文字技术开发应用等语言服务。
根据北京语言大学国际语言服务研究院即将发布的《中国语言服务市场发展报告》(2024)统计,截至2023年底,我国的机器翻译与智能语言服务市场总产值为616.9649亿元,全国机器翻译与智能语言服务从业者达288735人。招聘网站数据显示,2024年6月,各类智能语言服务招聘岗位需求为26989个,这反映出机器翻译与智能语言服务市场人才需求的旺盛。培养和储备适应人工智能新技术的语言人才是企业发展的关键。
发展智能语言服务学科
具有重要价值
面对我国日益增长的智能语言服务市场,培养国家需要的智能语言服务人才显得十分迫切和必要。智能语言服务学科建设只能依靠自主创新,走中国特色的自主知识体系创新道路,国际上没有现成的智能语言服务学科模式和学科经验可以借鉴。北京语言大学在相关学科领域进行了有益的尝试,先后在中国语言文学一级学科下自主设立了“语言智能与技术”二级学科(语言智能与技术方向、语言数据挖掘方向)和“语言资源学”二级学科(语言资源建设方向);在外国语言文学一级学科下自主设立了“国际语言服务”二级学科(语言智能教育研究方向),奠定了一定的学科基础,但学科方向没有形成完整的学科体系。
智能语言服务学科是智能语言服务教育的学科依托,具有重要的学科价值和教育价值。就学科价值而言,首先,智能语言服务学科具有学科交叉性,融合了语言学、计算机科学、人工智能、数据科学和认知科学等多个学科,推动了跨学科研究的发展。其次,智能语言服务学科具有技术创新性,神经机器翻译和预训练语言模型技术不仅极大地提升了语言服务的效率和水平,还推动了其他相关技术的发展。再次,智能语言服务学科具有社会服务性,可以更好地满足社会对高效、准确语言服务的需求,促进社会发展,提升公共服务的质量。
就教育价值而言,第一,智能语言服务学科具有人才培养价值,有助于培养既通语言又懂人工智能和数据技术的复合型人才,能在科技公司、政府机构、翻译行业、国际组织中发挥竞争优势。第二,智能语言服务学科具有教育创新价值,推动教育内容的迭代和创新,促使高校优化课程设置,更新教学内容。机器翻译、语音识别、文本生成等领域的新成果和新应用为课程注入了更多前沿性内容,增加了科技含金量。第三,智能语言服务学科具有提升能力的价值,能促进学生获得实践经验,将所学知识应用于解决实际问题,从而提高应用能力和创新能力。第四,智能语言服务学科具有持续学习的价值,不断促进从业者学习新知识,提升自身技能,保持竞争力和创新力。建设智能语言服务学科不仅学术意义重大,而且对我国的经济社会发展影响深远。
智能语言服务
学科体系建设重点
智能语言服务学科需要重点建设以下四个核心学科方向,即语言智能学、语言数据学、计算翻译学和翻译技术学,应大力培养我国汉外语言智能、汉外语言数据、汉外机器翻译和汉外翻译技术领域的语言人才。
语言智能学结合了语言学、计算机科学、人工智能、认知科学等领域,旨在研究和开发能够理解、生成、处理和应用自然语言的智能系统。目标是通过计算机和人工智能技术实现对人类语言的全面理解和应用,从而提升语言服务的效率和质量。研究重点包括自然语言理解、自然语言生成、对话聊天系统、文本情感分析等。
语言数据学结合语言学与数据科学,旨在通过数据分析、机器学习和统计方法,研究和处理语言数据。目标是通过大数据技术和算法分析,从海量语言数据中提取有价值的信息和知识,应用于自然语言处理、语言研究和实际应用中。研究重点包括语料库构建、数据标注与清洗、数据分析与挖掘、语言资源管理等。
计算翻译学结合了翻译学、计算语言学、计算机科学和人工智能,致力于利用计算技术实现和改进翻译过程,提高翻译效率和翻译质量。研究内容广泛,涵盖理论研究、技术开发和实际应用。研究重点包括翻译理论与模型、机器翻译、翻译质量评估、翻译平行语料库建设与分析、多语言与跨语言处理等。
翻译技术学结合翻译学、计算机科学、信息技术和项目管理,研究和开发各种技术工具和方法,支持和改进翻译过程,涵盖从翻译工具的开发和应用到翻译流程的自动化和优化。研究重点包括翻译工具的开发与应用、翻译管理系统、自动化工作流程、翻译质量控制、多语言内容管理等。
智能语言服务学科的四个学科方向之间既有共同点,又有区别,相互之间既有密切联系,又相对独立,各有侧重,一同构成了智能语言服务学科的学科生态体系。
从学科共同点看,四个学科方向都是交叉学科,结合了语言学和计算机科学,注重跨学科的研究和应用;四个学科方向都由技术驱动,依赖于先进的计算技术、人工智能、机器学习和大数据分析;四个学科方向都应用广泛,应用于智能语言教育、智能传播、智能商务等众多领域。
从学科不同点看,四个学科方向都有各自的研究重点,语言智能学侧重于理解和生成自然语言;语言数据学专注于语言数据的处理和分析;计算翻译学主要研究机器翻译过程和质量评价,以及多语言处理;翻译技术学则关注计算机辅助翻译工具应用、翻译过程的优化和翻译项目管理。
未来,智能语言服务将融合新技术和实际需求,通过深度学习、多模态处理、个性化服务和隐私保护等方面的创新,推动语言服务向更智能、更高效和更安全的方向发展。智能语言服务学科和智能语义服务人才将大有可为。
(作者系北京语言大学高级翻译学院教授)