您现在的位置: 首页 > 阅读详情
论人工智能技术在我国档案工作中的应用
 
发布日期:2024-03-14     来源:档案管理杂志社编辑部      作者:马仁杰 邓齐凤      浏览次数:2727     字体:      

从档案收管用三个业务环节出发,探讨人工智能技术应用于我国档案工作面临的问题,提出人工智能技术应用于我国档案工作中的建议,以提高我国档案工作的水平。通过文献研究和案例分析,总结人工智能技术应用于我国档案工作中存在的问题,并在此基础上提出优化建议。人工智能技术在我国档案工作中的应用前景广阔,目前已有的实践案例对促进人工智能技术在我国档案工作中的应用起到了积极作用。

2021年11月1日,国家工业和信息化部等13部门联合印发了《无障碍环境建设“十四五”实施方案》。该方案明确提出,到2025年,无障碍环境建设法律保障机制更加健全,无障碍基本公共服务体系更加完备,信息无障碍服务深度应用。信息无障碍概念,最早于1997年2月提出,提出者为国际著名的标准化组织——万维网联盟。万维网联盟为了提升网络操作中的无障碍性,成立了网络无障碍推动小组,并制定了一系列有关于网络无障碍的标准规范等。自2004年我国第一次举办信息无障碍论坛后,信息无障碍的理念开始贯彻在我国的各个领域,直至今日,我国信息无障碍建设水平已经从起步过渡至发展阶段。2021年,头部互联网企业纷纷开展无障碍行动,推动行业无障碍技术飞速发展。[1]让科技助力信息无障碍发展,这为人工智能在档案网站无障碍建设中的应用奠定了基础。

1、人工智能技术在我国档案工作中的应用现状

人工智能的主要技术有机器学习、深度学习、计算机视觉、自然语言处理等,这些技术在我国档案收管用工作环节已有不同程度的应用。为了深入了解我国应用人工智能技术开展档案工作的现状,通过对中国全文期刊数据库(CNKI)、万方数据库、维普数据库、超星等平台进行文献检索,采用文献研究法和案例分析法,系统梳理人工智能技术在我国档案工作中的应用现状。

1.1 人工智能技术在档案收集中的应用。在信息技术高度发达的时代,档案资源数量繁多、种类丰富,具有多来源、多模态的特点。面对纷繁复杂,多源异质的档案资源,融合数据采集、智能转录、模式识别、专家系统等人工智能技术,能有效提升档案收集的质量和效率,提高档案收集的智能化水平。[9]我国在文字档案、图像档案、音频档案、视频档案等跨模态档案资源的智能收集实践中,均涉及人工智能技术。例如,安徽省档案馆借助OCR识别技术对简体手写体档案和民国繁体档案等历史档案进行识别,完成历史档案信息的智能收集[10];北京市市场监督管理局利用人工智能技术中的图像识别和信息抽取技术,对现存的图像档案进行批量智能自动识别处理,实现图像档案信息的智能收集[11];浙江省档案馆与科大讯飞公司合作,运用AI识别、转写等技术实现对音频档案的采集和著录,[12]完成音频档案的智能收集;云南税务部门利用人工智能技术中的模式识别技术抽取视频档案的内容,从而完成税务执法视频档案的智能收集。[13]

1.2 人工智能技术在档案管理中的应用。人工智能技术在档案管理中的应用主要体现在档案智能保存、档案智能整理、档案智能价值鉴定、档案智能检索和档案智能安全管理五个方面。

1.2.1 档案智能保存。随着信息技术的飞速发展,传统的档案保存方式已不再适合新技术环境的要求,人工智能融入电子文件管理系统,可以优化档案保存的性能,实现文件自动化归档保存。针对档案智能保存,我国很早就开展了相关实践,如2020年中国石油数字档案管理系统利用人工智能及其他新兴技术,集成电子公文、财务管理等多个系统,实现电子化公文、会计票据等自动归档保存。[14]不仅如此,杭州远大档案技术有限公司借助人工智能中的机器学习技术,实现电子文件自动整理、在线归档和精细管控,保证归档电子文件的真实性和完整性。人工智能技术在我国档案智能保存中的应用,能够实现多元档案数据的智能化归档和分类,为后续的智能检索和利用等奠定基础。

1.2.2 档案智能整理。人工智能凭借先进的算法和模型,可以辅助档案自动化分类、归档,提高档案整理的效率。我国各地档案机构针对人工智能技术在档案整理领域的应用纷纷开展试点,如山东省威海市环翠区档案馆在积极推进国家级单套制、单轨制试点过程中,使用了智能采集模型的人工智能技术,实现了电子文件区域智能归档整理和档案信息资源共享[15];广州供电局会计档案电子化试点项目借助人工智能技术实现会计档案的自动整理和元数据的自动生成。[16]人工智能在我国档案智能整理中的应用涵盖多个方面,除了自动归档、分类,还包括辅助档案智能编研等内容。

1.2.3 档案智能价值鉴定。人工智能中的自然语言处理技术支持模糊查询和快速定位,能够自动识别档案内容中的语义信息,解决人工质检档案漏检、错检等问题,有效提高档案价值鉴定的质量和效率。例如,江苏省张家港市档案局依托人工智能技术开发出电子档案检校系统,能够自动对数字化扫描件的目录、影像偏正、页面缺漏等进行全面检测校验,弥补了传统人工抽检的不足。[17]同时,辽宁省档案馆借助机器学习、专家系统、语义分析等人工智能技术,构建多维语义理解算法模型,从敏感词、敏感语句、敏感图像等多角度对档案全件进行语义分析,提升档案价值鉴定业务的智能化水平。[18]此外,国家安全监督管理局总局档案馆结合保管期限判定原则,依托人工智能中的专家系统分析档案内容,实现计算机辅助判定档案保管期限的功能。

1.2.4 档案智能检索。人工智能技术在档案检索中的应用,可以增强档案信息的可搜索性,有效提高档案检索效率。为提升档案检索的智能化水平,太仓市档案馆和河南省数字档案馆都应用人工智能技术开展了相关的实践探索。江苏省太仓市档案馆利用智能代理技术,实现对馆藏档案的全文检索。[19]河南省数字档案馆借助智能检索系统,挖掘出大量结构化和非结构化馆藏资源,通过档案数据间的关联形成知识图谱和档案知识库,提高了馆藏档案检索的查全率和查准率。[20]

1.2.5 档案智能安全管理。档案安全管理包括档案库房安全管理和数字档案安全管理,在档案库房安全管理方面,人工智能技术能够对人脸、声音、指纹等信息进行识别和加密,从而对档案存放位置、库房“八防”状况进行实时感知和跟踪,以此建立完备的智能安防系统。在新冠肺炎疫情期间,国网湖北省电力公司武汉供电公司充分利用智能档案库房建设成果,发挥库房智能环境控制系统、智能消防系统和安防系统的作用,减少人员接触,有效保障档案库房和档案实体的安全。[21]此外,宁波市鄞州区档案馆开发出“可信认证+人脸识别”系统,通过利用人工智能技术中的人脸识别辅助验证用户身份,排除安全隐患。在数字档案安全管理方面,通过相关技术手段,人工智能可以预测潜在的安全风险,并提前加以防范。例如,科大讯飞的档案超脑平台2.0版本内置专业语料库,形成完全本地化保存的档案数据,实现与互联网的完全隔离,保证档案数据的安全可靠。

1.3 人工智能技术在档案利用中的应用。人工智能技术在我国档案利用中的应用主要体现在档案服务方面。一方面,人工智能技术中的数据挖掘、数据分析、知识地图等技术能够细化档案资源的颗粒度,挖掘档案信息间的内在联系和发展脉络,并以可视化的形式展示档案资源中的关系网络,最大限度地盘活档案信息的潜在价值,如上海市档案馆应用人工智能技术打造“跟着档案观上海”数字人文平台,为了解上海的历史发展提供档案数据支撑。[23]另一方面,人工智能中的用户画像、专家系统等技术,可以深度分析用户的利用需求和偏好,预测其可能感兴趣的档案类型,主动为其推送相关档案信息,如广州市妇女儿童医疗中心借助人工智能技术挖掘病历档案数据,实现儿科疾病的智能化诊断。

2、人工智能技术在我国档案工作应用中存在的问题

通过系统梳理人工智能技术在我国档案工作中的应用现状,结合国内学者有关“人工智能+档案”的研究成果,我们发现我国档案工作全程智能化尚未实现。档案工作的全程智能化是指档案在进行收管用的过程中,形成的一整套智能化、整体化的档案工作模式。尽管我国档案工作智能化实践场景不断丰富,但目前人工智能技术与档案工作收管用的融合更多地表现在某一工作环节的智能化,档案工作全程智能化有待实现。目前,制约我国档案工作全程智能化的因素主要有以下几个方面。

2.1 政策制定和实施不到位。人工智能技术在档案工作全程智能化发展中起关键作用,尽管我国出台了《全球人工智能发展白皮书》《“十四五”全国档案事业发展规划》等有关人工智能技术应用的政策,但在落实过程中,存在政策制定不到位和政策实施不到位的问题。一方面,有关档案工作全程智能化的政策制定不到位。《“十四五”全国档案事业发展规划》明确了大数据、人工智能等推动数字档案馆(室)建设优化升级的政策导向,但这只是国家在宏观层面的政策指引,有关档案工作全程智能化的应用规范等微观层面的规定并未提及,使得各地档案馆无从下手。另一方面,有关档案工作全程智能化的政策实施不到位。纵观我国开展的人工智能辅助档案工作的实践可知,档案工作极其复杂,涉及收管用多个环节,虽然我国部分地区已经针对人工智能技术开展档案工作试点实验,但其大多倾向于将人工智能技术应用于重复性较高的档案工作,并未将人工智能技术应用于档案工作的收管用全过程,未能实现档案工作的全程智能化。可见,尽管人工智能技术在档案工作中的应用前景广阔,但政策制定和实施不到位是实现档案工作全程智能化的重要影响因素。

2.2 资金投入不足。应用人工智能技术实现档案工作全程智能化离不开大量资金的支持,首先,人工智能技术在档案收管用各环节的应用依赖大量软硬件设备的支持,如开发智能化的档案检索和分类算法、建立智能档案管理系统等需要购置相关的软件设备,实现照片、图像、手写文字等跨模态档案资源的智能收集需要购置扫描仪、大容量存储设备等硬件设备,这些软硬件设备的置办需要花费大量资金。其次,人工智能技术在档案工作全程智能化的应用需要引进相关的研发人员和技术专家,专业人员的引进同样需要花费大量资金。最后,随着人工智能技术的不断发展,原有的系统和算法需要不断优化和升级,人工智能技术在档案工作全程智能化应用中持续维护和更新的成本也需要大量资金的支持。但现阶段,各地档案部门对资金投入的需求和我国对于应用人工智能技术实现档案工作全程智能化的资金投入不足产生矛盾,这对于经费有限的档案部门来说,无疑是一大障碍。

2.3 档案数据标准不统一。真实、完整的档案数据是应用人工智能技术开展档案工作全程智能化的基础,档案数据的质量决定档案工作的水平,档案数据质量参差不齐会导致人工智能算法在处理档案数据时出现错误或失效,进而影响档案工作全程智能化的顺利开展。目前,我国各地档案部门产生的档案数据所依据的技术标准、管理规范不尽相同,这使得档案数据在分类标准、存储格式、目录规范等方面存在较大差异,[25]导致档案数据质量参差不齐、档案数据标准不统一。我国档案资源基数大,不同载体形式的档案数量繁多,面对纷繁复杂、多源异质的档案资源,[26]档案数据标准不统一会严重影响档案数据收集的真实性、完整性、可用性和安全性,严重阻碍档案全生命周期管理模式的实施,不利于档案工作全程智能化的开展。

2.4 档案数据孤岛现象。2021年,新修订的《中华人民共和国档案法》明确提出“推进档案信息资源共享服务平台建设,推动档案数字资源跨区域、跨部门共享利用”的要求。[27]目前,我国部分地区档案数据接口不开放、档案数据共享机制不健全,使得档案数据资源呈现分散化、碎片化的现象,这导致不同档案部门和业务系统之间无法实现档案数据的高效流通和共享,进而形成档案数据孤岛现象。全面、高质、多样的档案数据是人工智能技术在档案工作中应用的基础,各档案部门间的档案数据共享是保证档案工作全程智能化顺利开展的前提,档案数据孤岛现象会形成档案数据资源浪费,影响档案数据的完整性、可用性和可靠性,严重阻碍人工智能技术在档案工作全程智能化应用中的发展进程。

2.5 档案人才问题。人工智能技术为我国档案事业的发展带来了新契机,但各地档案部门工作人员的综合素质和能力水平参差不齐,对应用人工智能技术实现档案工作全程智能化的认识不同,这在很大程度上制约了我国档案工作全程智能化的建设水平。一方面,人工智能等新技术的应用使档案工作模式发生许多变化,部分档案工作者尚未适应角色转变,对应用人工智能技术开展档案工作持有不同看法,这导致许多档案工作者仍坚持传统的档案工作原则和方法,极大地影响了人工智能技术推进档案工作全程智能化的发展进程。另一方面,自然语言处理、模式识别、专家系统等人工智能技术涉及计算机科学、数学、统计学等多方面的知识,这要求档案工作者必须具备持续学习和自我更新的能力,但许多档案工作者的教育背景、工作经验和专业技能参差不齐,其对运用人工智能技术开展档案工作的理解不同,这就影响了人工智能技术在档案工作全程智能化领域的应用效果。

3、人工智能技术应用于我国档案工作中的优化建议

3.1 加快出台并实施相关政策。档案工作全程智能化的实现离不开国家政策的支持,在政策制定层面,我国政府部门应重视人工智能技术在档案工作全程智能化发展中的应用,加强各地档案机构对档案工作全程智能化的理解,进一步细化政策指导,通过制定统一的标准支持技术创新和应用推广,以此推动档案工作的优化升级。在政策实施层面,档案部门应联合企业、相关科研机构加强技术研发,通过开展算法优化、模型设计及训练等适配工作,拓宽更多的应用场景并开展试点工作,积极落实人工智能技术在档案工作全程智能化应用中的政策。[28]不仅如此,在新一轮科技革命和产业变革的浪潮中,人工智能与大数据、物联网、云计算、区块链等新一代信息技术之间存在着紧密的联系。为实现档案工作全程智能化,必须配套使用云计算、大数据、区块链、虚拟现实等新技术,如:在档案智能收集方面,“人工智能+云计算”能够拓展档案资源的存储空间,实现存量档案的数字化;在档案智能管理方面,“人工智能+大数据”能够实现多源异质档案数据的统一划分,满足档案管理的智能分类、智能检索和智能安全防护等要求;在档案智能保存方面,“人工智能+区块链”能够提供可信、可靠的流程跟踪溯源,确保档案数据的不可篡改性和可追溯性;在档案智能利用方面,“人工智能+虚拟现实”能够满足用户的个性化档案利用需求,增强用户档案服务体验。人工智能技术与其他先进技术的集约化应用,可以有效破除人工智能在档案工作应用中的技术不成熟问题,进而推动政策落实,早日实现档案工作全程智能化。

3.2 加大资金投入。充足的资金是保障档案工作全程智能化顺利开展的前提,为解决资金投入不足问题,首先,我国政府部门应将人工智能技术在档案工作中的应用纳入经费预算,加强对人工智能技术应用于档案工作全程智能化领域的资金投入,同时,鼓励和支持相关企业、科研机构开展技术研发和应用,推动人工智能技术在档案工作全程智能化应用中的发展。其次,对于应用人工智能技术开展档案工作全程智能化试点的档案机构,政府部门应出台相关的措施,保证专项资金供给和投入,以此提高各档案机构应用人工智能技术实现档案工作全程智能化的主动性和积极性。最后,各机关、团体、企业事业单位要做好本单位档案工作的经费预算,加大对应用人工智能技术实现档案工作全程智能化的经费投入,同时,各地档案机构可以与高校、企业、科研机构等进行合作,共享资源和技术,降低研发成本。

3.3 统一档案数据标准。档案数据贯彻人工智能技术应用于档案收管用工作的全过程,为消除各档案部门对档案数据定义的理解差异,解决档案数据孤岛问题,需要制定统一的档案数据标准。根据统一领导、分级管理的原则,国家档案局应在宏观层面建立统一的档案数据标准体系,各地档案机构再按照宏观层面的指引,制订相应的业务规范与行业标准。在档案收集层面,通过应用人工智能技术,统一文本档案、图像档案、音频档案、视频档案在内容识别、数据录入、数据分类、元数据描述等方面的档案数据收集规范,保障档案数据与实体档案内容的一致性。在档案管理层面,统一档案数据的数据格式、数据编码、数据存储结构、数据归档范围与数据集成规则等标准,[29]保障档案数据的真实性、完整性、可用性、安全性。在档案利用层面,统一开放档案数据的范围和时间,保证档案数据的安全性和可用性。通过统一档案数据标准,有利于档案数据在档案收管用各环节的流动,促进人工智能技术在档案工作全程智能化中的应用。

3.4 打破数据孤岛现象。未来是“数据为王”的时代,为打破不同区域、不同部门间出现的“档案数据孤岛”现象,首先,建立统一的档案数据共建共享平台。一方面,依托全国档案查询利用服务平台建立全国范围内的档案数据共享机制,推动国家、地区档案数据共享平台一体化发展;另一方面,加强各地区档案机构档案数据共建共享平台建设,通过建立档案全文数据库和档案目录数据库,实现档案数据跨层级、跨部门共享利用,保障档案数据互联互通,消除档案数据孤岛障碍。其次,加强档案数据的安全保护和管理。通过建立完善的档案数据备份和恢复机制,采用先进的加密技术和访问控制策略,确保档案数据的完整性、保密性和可用性,防止档案数据泄露和滥用。[30]最后,利用人工智能技术,加强对档案数据共建共享平台的维护和升级,确保档案数据共享持续稳定,满足档案工作全程智能化的档案数据要求。

3.5 加强档案人才队伍建设。目前,人工智能技术尚未成熟,当前及未来一个时期内的档案工作全程智能化还需要人的参与,[31]为了应对人工智能技术给档案人才队伍建设带来的冲击与挑战,我国各地档案机构需要培养出兼具档案管理理论和人工智能技术的综合性高素质人才。首先,档案机构要及时调整档案工作者的角色定位,加大对档案工作人员的培训力度。随着人工智能技术的应用,档案工作者逐渐由传统的档案管理者转变为技术应用者和创新者,他们需要具备数据分析和解读等相关技能,能够利用人工智能技术对档案数据进行智能化处理和管理。为适应角色转变,档案机构可以通过组织内部培训、邀请专家开展讲座等方式加强对档案工作人员的意识转变和技能培训,不断更新其技术知识和实践操作能力。其次,档案机构可以与互联网企业、高校、科研机构等开展跨界协同合作,[32]积极组建智能化档案工作研发团队,结合人工智能与其他技术的特点和档案工作的方法与规律进行深入探究,不断提升档案工作人员的科研能力和创新能力。最后,学校要优化档案学专业人才培养方案。在档案学的课程设置中,高校要找到人工智能技术与档案工作结合的切入点,增设与人工智能技术相关的专业课程,如机器学习、数据挖掘、自然语言处理等,以此为档案机构培养出适应新时代发展的复合型高素质档案专业人才。

上一篇:2024全国两会,“档案事业”写进政府工作报告!
下一篇:新修订一部法律《中华人民共和国保守国家秘密法》,2024年5月1日起施行!