前 言
本标准由安徽省档案局(馆)提出。
本标准由国家档案局归口。
本标准起草单位:安徽省档案局(馆)、北京北大方正技术研究院有限公司。
本标准主要起草人:李学香、黄玉明、周建武、胡华平、王学武、邓晓文、段丽琼、吴彬松、华婷、陈姗姗、朱霖露。
引 言
元数据是描述文件的背景、内容、结构及其管理过程的数据。元数据管理有助于保证电子文件的真实性、完整性、可靠性、可用性,保障电子文件的证据特性,便于对电子文件的理解、管理、交换和利用,是电子文件管理中必不可少的一部分。
随着电子文件的大量生成,有必要为创建、管理、应用元数据建立统一的方案,以系统有效地记录电子文件的内容特征、形式特征、背景和管理过程信息,为电子政务、办公自动化、文件及档案管理系统的设计提供依据,并全面实现元数据的多种功能和用途。本标准参照ISO 15489《信息与文献 文件管理》、ISO 23081《信息与文献文件管理过程文件元数据》、档案行业标准DA/T 18-1999《档案著录规则》、国际档案理事会标准《国际标准档案著录规则(总则)》,并结合我国电子文件管理实际,规定了文书类电子文件元数据集以及元数据元素关系间的逻辑架构。
文书类电子文件元数据方案
1 范围>
本标准规定了以文件和案卷形式的档案为对象的文书类电子文件形成、交换、归档、移交、保管、利用等全过程元数据设计、捕获、著录的一般要求。
本标准适用于各级各类档案馆、机关、团体、企业事业单位和其他社会组织对计算机系统中直接生成的文书类电子文件(含纸质文件/档案数字化图像、文本)的管理。
2 规范性引用文件
下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB 2312-1980 信息交换用汉字编码字符集基本集
GB/T 4880.2-2000 语种代码名称第2部分:3字母代码 (eqv ISO 639-2:1998)
GB/T 4881 中国语种代码
GB/T 7156-2003 文献保密等级代码与标识
GB/T 7408-2005 数据元和交换格式信息交换 日期和时间表示法 (idt ISO 8601:2000)
GB 11714-1997 全国组织机构代码编制规则
GB/T 15418 档案分类标引规则
GB 18030-2005 信息技术中文编码字符集
GB/T 18894-2002 电子文件归档与管理规范
DA/T 1-2000 档案工作基本术语
DA/T 13-1994 档号编制规则
DA/T 14-1994 全宗指南编制规范
DA/T 18-1999 档案著录规则
DA/T 22-2000 归档文件整理规则
DA/T 31-2005 纸质档案数字化技术规范
ISO 11179-3:2003 信息与技术 元数据注册系统(MDR) 第3部分 注册系统元模型和基本属性(Information technology-Metadata registries (MDR)-Part 3:Registry metamodel and basic attributes)
ISO 15489-1:2001 >信息与文献文件管理 第1部分 通则(Information and documentation-Records management-Part 1:General)
ISO 23081-1:2006 信息与文献文件管理过程文件元数据 第1部分 原则(Information and documentation-Records management processes-Metadata for records-Part 1: Principles)
ISO/TS 23081-2:2007 信息与文献文件管理过程文件元数据 第2部分 概念与实施(Information and documentation-Records management processes-Metadata for records- Part 2: Conceptual and implementation issues)
3 术语和定义
DA/T 1-2000界定的以及下列术语和定义适用于本文件。
3.1
电子文件 electronic records>
指在数字设备及环境中生成,以数码形式存储于磁带、磁盘、光盘等载体,依赖计算机等数字设备阅读、处理,并可在通信网络上传送的文件。
[GB/T 18894-2002,定义3.1]
3.2
文书类电子文件 administrative electronic records>
反映党务、政务、生产经营管理等各项管理活动的电子文件。
3.3
组合文件combined records>
由若干个联系紧密的文档组成、视为一个文件著录的文档集合体。
3.4
文档 document>
归档文件最小的文件单元,可以是一个独立的自然件,也可以是组合文件中的某一自然件或某一自然件的附件。
3.5
元数据metadata>
描述文件的背景、内容、结构及其整个管理过程的数据。
[ISO 15489-1:2001,定义3.12]
3.6
元素 element>
通过标识、定义、约束性、值域等一组属性描述的数据单元。
3.7
简单型 simple> type
不具有子元素的元素所对应的元素类型。
3.8
容器型 container> type
具有子元素且本身不能被赋值的元素所对应的元素类型。
3.9
复合型 >complex type
本身可以被赋值且在一定条件下可以具有子元素的元素所对应的元素类型。
3.10
捕获 capture>
适时获取电子文件及其元数据的方法和过程。
3.11
实体 entity>
任何已经存在的、将要存在的或可能存在的具体的或抽象的事物,包括事物间的联系。
[ISO 23081-2:2007,定义3.6]
4 元数据元素、结构及描述方法>
4.1 元数据元素及其结构>
本标准参考ISO 23081,结合目前我国电子文件管理实际,将文书类电子文件元数据从概念层次上区分为文件实体元数据、机构人员实体元数据、业务实体元数据、实体关系元数据四个域,每个域包含的元数据元素及其结构规定如下:
表1 文件实体元数据 |
编号 |
元数据 |
编号 |
元数据 |
M1 |
聚合层次 |
|
|
M2 |
来源 |
M3 |
档案馆名称 |
M4 |
档案馆代码 |
M5 |
全宗名称 |
M6 |
立档单位名称 |
M7 |
电子文件号 |
|
|
M8 |
档号 |
M9 |
全宗号 |
M10 |
目录号 |
M11 |
年度 |
M12 |
保管期限 |
M13 |
机构或问题 |
M14 |
类别号 |
M15 |
室编案卷号 |
M16 |
馆编案卷号 |
M17 |
室编件号 |
M18 |
馆编件号 |
M19 |
文档序号 |
M20 |
页号 |
M21 |
内容描述 |
M22 |
题名 |
M23 |
并列题名 |
M24 |
副题名 |
M25 |
说明题名文字 |
M26 |
主题词 |
M27 |
关键词 |
M28 |
人名 |
M29 |
摘要 |
M30 |
分类号 |
M31 |
文件编号 |
M32 |
责任者 |
M33 |
日期 |
M34 |
文种 |
M35 |
紧急程度 |
M36 |
主送 |
M37 |
抄送 |
M38 |
密级 |
M39 |
保密期限 |
M40 |
形式特征 |
M41 |
文件组合类型 |
M42 |
件数 |
M43 |
页数 |
M44 |
语种 |
M45
|
稿本 |
M46 |
电子属性 |
M47 |
格式信息 |
M48 |
计算机文件名 |
M49 |
计算机文件大小 |
M50 |
文档创建程序 |
M51 |
信息系统描述 |
M52 |
数字化属性 |
M53 |
数字化对象形态 |
M54 |
扫描分辨率 |
M55 |
扫描色彩模式 |
M56 |
图像压缩方案 |
M57 |
电子签名 |
M58 |
签名规则 |
M59 |
签名时间 |
M60 |
签名人 |
M61 |
签名结果 |
M62 |
证书 |
M63 |
证书引证 |
M64 |
签名算法标识 |
M65 |
存储位置 |
M66 |
当前位置 |
M67 |
脱机载体编号 |
M68 |
脱机载体存址 |
M69 |
缩微号 |
M70 |
权限管理 |
M71 |
知识产权说明 |
M72 |
授权对象 |
M73 |
授权行为 |
M74 |
控制标识 |
M75 |
附注 |
|
|
表2 机构人员实体元数据
编号 |
元数据 |
编号 |
元数据 |
M76 |
机构人员类型 |
|
|
M77 |
机构人员名称 |
|
|
M78 |
组织机构代码 |
|
|
M79 |
个人职位 |
|
|
表3 业务实体元数据
编号 |
元数据 |
编号 |
元数据 |
M80 |
业务状态 |
|
|
M81 |
业务行为 |
|
|
M82 |
行为时间 |
|
|
M83 |
行为依据 |
|
|
M84 |
行为描述 |
|
|
表4 实体关系元数据
编号 |
元数据 |
编号 |
元数据 |
M85 |
实体标识符 |
|
|
M86 |
关系类型 |
|
|
M87 |
关系 |
|
|
M88 |
关系描述 |
|
|
4.2 元数据的描述方法>
本标准参考ISO 11179.3:2003,采用表5所示方法对元数据元素进行描述。
本标准所描述的元数据元素有四个属性相同:
——注册版本:1.0;
——注册机构:中华人民共和国国家档案局;
——字符集:GB 2312-1980、GB 18030-2005;
——语言:中文。
表5 元数据元素描述方法
编号 |
按一定规则排列的元数据的顺序号 |
中文名称 |
元数据元素的中文标识 |
英文名称 |
元数据元素的英文标识 |
定义 |
元数据元素含义的描述 |
目的 |
描述该元数据元素必要性和作用 |
约束性 |
说明采用该元数据元素的强制性程度,分“必选”、“条件选”和“可选”。“必选”表示总是强制采用;“条件选”表示在特定环境和条件下必须采用;“可选”表示可采用也可不采用,由用户根据需要确定 |
可重复性 |
元数据元素是否可以重复出现 |
元素类型 |
元数据元素所属的类别。本标准将元素分为简单型、容器型和复合型 |
数据类型 |
为表达元数据元素值而规定的具有相同数学特性和相同操作集的数据类别。本标准数据类型包括字符型、数值型、日期时间型。容器型元素没有数据类型 |
编码修饰体系 |
对该元数据元素信息的描述应遵循的编码规则,包括编码修饰体系的标识和名称 |
值域 |
可以分配给元数据元素的值 |
缺省值 |
该元数据元素的默认值 |
子元素 |
该元数据元素具有的下属元素 |
信息来源 |
元数据元素值的来源 |
相关元素 |
与该元素有密切联系的元素 |
注释 |
对元素的进一步说明 |
|