電子檔案長期保存策略 - archives.gov.tw · 2017-06-20 ·...
TRANSCRIPT
-
1
電子檔案長期保存策略
檔案管理局
檔案資訊組
-
2
2017/6/20
2
大 綱
• 電子檔案長期保存需求及議題
• 電子檔案長期保存方法
• 電子檔案國際重要計畫
• 電子檔案長期保存策略
-
3
電子檔案長期保存需求及相關議題
-
4
2017/6/20
4
數位化的目的與風險
數位化目的
歷史記憶資產保存?
學術研究?
民眾應用?
風險
電子檔案儲存媒體!
電子檔案格式!
系統與軟體!
硬體設施!
人員維修能力!
保存方法!
安全!
不要為了數位化而數位化
數位化只會加重成本,不會減少支出
成本
效益
安全
便利
數位記憶會消失
-
5
電子檔案儲存媒體
-
6
文字檔案 xml、pdf、odf 、 txt、rtf、doc、 ppt、
圖片、影像檔案
tiff 、png、jpeg、wdl、 Pdf、iges、dxf、step、 jpg、bmp、gif
聲音檔案
wav 、mp3、 midi、wma、ra
影音、視訊檔案
mpeg-2、avi、mpeg-4、 wmv、rm、mov
電子檔案格式
-
7
電子檔案國際重要計畫
-
8
8
電子檔案國際上重要計畫
澳洲 維多利亞省VERS策略 團體計畫
加拿大 InterPARES計畫
美國 ERA計畫
芬蘭 2010年國家檔案館策略 英國 數位化專案、PRONOM 計畫 荷蘭 E-DePot Dioscur計畫 歐盟 MoReq
我國 國家檔案數位服務計畫
-
9
加拿大 InterPARES計畫 The International Research on Permanent Authentic Records in Electronic Systems
•第一階段,時程為1999至2001年,主要研究在電子資訊系統
或電子文件紀錄中,電子檔案擇選的方法及保存作業,共分
為電子檔案真實性(Authenticity)、電子檔案評鑑
(Appraisal)、電子檔案保存(Preservation) 及電子檔案發
展策略(Strategy)等四大領域。
•第二階段,時程為2002至2006年。目標著重在藝術、科學及
電子化政府等不同領域之電子檔案,確保這些電子檔案的真
實性、可信賴性的概念、原則、條件、標準及方法論。
-
10
美國ERA計畫 Electronic Records Archives
•美國國家檔案及文件署 (National Archives and Records Administration,NARA)與聯邦政府合作,發展電子檔案管理的政策與規範。
•發展及維持讀取、保存、描述、使用與清理政府電子檔案的能力。
•發展一套全國一致且持久的電子檔案管理系統。
•確保任何人在任何時間、地點,都能找到方法使用所保存的電子檔案。
•在電子檔案的蒐集、保管、清理等不同生命週期,都可隨時使用該檔案。
-
11
澳 洲 團體計畫(Corporate Plan)
•澳洲國家檔案局在2006年至2009年團體計
畫,提出國家檔案兩大目標與策略:
–提供各機關檔案管理之軟體產品與服務,並
且確保電子檔案具完整、真實與可靠性。
–確保澳洲人民均可存取由國家檔案局保存之
寶貴資料,讓民眾更進一步瞭解國家之歷史背
景與民主制度。
-
12
澳洲維多利亞省 VERS Victorian Electronic Records Strategy
•訂定一套具體的電子檔案標準格式
–可與現行檔案管理系統相容。
–確保各種系統所產生之檔案,未來皆可被讀取與閱覽。
–提供自動蒐集檔案的具體方法,使各種來源之檔案均可妥善保管。
–提出封裝電子檔案的具體方法,使電子檔案之相關資料,在未來仍可完整與清楚的呈現。
–規劃確保檔案安全之方法,可偵測檔案是否遭到竄改。
-
13
歐盟Planets計畫 Preservation and Long-term Access
through Networked Services
•此計畫的參與單位包括16 個來自歐盟體系
的圖書館、檔案管理局、大學、廠商,並
由英國國家圖書館負責相關協調工作。
•為確保數位資料的長期保存與讀取,於
2006開始為期四年、約1,400萬歐元的
Planets計畫。
-
14
歐盟 MoReq規範 Model Requirements for the Management
of Electronic Records
•於1996年12月成立的歐洲委員會論壇 (DLM Forum) ,
集合許多專家共同討論資訊化社會中,重要文化的保
存問題,認為電子檔案管理必須有一個標準的需求規
格(Model Requirements)。
•在2001年由Cornwell管理顧問公司提出電子檔案管理
功能需求規範MoReq,此規範主要是幫助組織確認電子
檔案管理系統與程序符合檔案管理原則的要求,目前
為全歐洲電子檔案管理的主要規範。
-
15
歐盟 MoReq2規範
•2006年,歐盟擴大MoReq需求規範成MoReq2
主要功能需求: –分類表和檔案組織(Classification Scheme and file organization)
–控制與安全(Controls and Security)
–保管與清理 (Retention and Disposition)
–取得(Capturing Records)
–引用參考(Referencing)
–查詢檢索與呈現(Searching, Retrieval and Presentation)
–管理功能(Administrative Functions)
–選用模組(Optional Moduls)
-
16
英國 數位化專案 Digitization Programme)
• 英國國家檔案局於2005年至2011年間推行數位化
專案。
• 確立數位化檔案的優先順序(如:優先數位化目前
最受民眾歡迎的檔案)、時程(如:開放大眾使用網
路檢索閱覽的時間表)。
-
17
英國 PRONOM 計畫
• 任何在辦公室電腦所產生的文書處理軟體、電子郵件、電
子試算表、簡報資料、圖形、影像與網頁資料文件等都列
入作業涵蓋範圍。
• 發展線上資訊系統,提供需要者以文件閱覽軟體(Viewer)
閱覽電子檔案,並研訂長期保存策略。
– 消極性長期保存策略,如提供安全的儲存環境及存取控制機制。
– 積極性長期保存策略,如提供技術知識庫服務。
特性描述 (Characterization)
長期保存作為 (Preservation Action)
長期保存規劃 (Preservation Planning)
技術知識庫服務 (Technical Registry
Services)
-
18
荷蘭 e-Depot計畫
•荷蘭國家圖書館於2003年提出的e-Depot計畫,其中一部分就是在進行長期保存研究案,目的是要發展一套電子文件長期保存策略,確保長期保存數位出版品的有效性。
•荷蘭國家圖書館、荷蘭國家檔案局及Tessella Support Service公司在2005年1月至2007年7月共同合作推動Dioscuri計畫,主要是發展模組化的模擬器。
•2008年11月公布0.4.0版模擬器,免費提供下載。
•2009年持續進行實驗及開發模組函式庫(Module Library),並將整合至e-Depot(電子資料庫Electronic Repository)作業流程中,預計2010開始提供模擬服務。
-
19
荷蘭Dioscuri計畫架構
函式庫
虛擬機器 控制器
模擬器的 規格文件
模擬器模組
資料庫 文件
瀏覽器 資料庫管理系統 應用軟體
原始系統軟體(作業系統)
介面
未來作業系統
未來硬體
載入
啟動虛擬機器 及模擬器
中央處理器
記憶體
硬碟
光碟
圖形
聲音
http://www.kb.nl/hrd/dd/dd_projecten/img/emulatie4.jpg
-
20
芬 蘭 2010年國家檔案館策略
•e化服務是客戶服務的重點。
•發展及健全電子檔案存取和長期保存的檔案管理系統。
•落實電子檔案長期保存和安全,確保資訊的完整性與可用性。
•制訂處理電子檔案生命週期之管理規範。
•培訓發展電子檔案管理專業知識。
-
21
綜合各國計畫重點
電子檔案有效性的確保
–真實性、完整性、可及性
電子檔案長期保存方法的發展
–檔案格式、儲存媒體、保存技術
電子檔案的呈現與應用
–內容呈現、原貌重現、網路應用
電子檔案管理專業知識的訓練
–概念、實作
電子檔案生命週期管理規範的制訂
–產生、蒐集、保管、清理、檢調、應用、稽核、安全
-
22
電子檔案常見保存方法
-
23
系統保存:將電腦軟硬體完整保留下來,類似建立電
腦博物館。
優點:可以完整呈現檔案原貌。
缺點:過期軟、硬體無人能懂,系統異常無人能救,硬體
故障無人能修,零件損壞沒有備料可供更換。
複製(Replication):為降低軟硬體故障的風險,在一個
或多個系統上重複製作一份或多份相同的資料,同時
可辦理異地存放。
優點:簡單方便。
缺點:無法解決電子檔案格式與硬體過時的問題。
常見保存方法-系統保存與複製
-
24
更新(Refreshing):為防止儲存媒體過時或失效,將電
子檔案內容從一儲存媒體複製至新的儲存媒體。如察
覺3.5吋磁片即將被淘汰,在軟碟機還存在時,提前將
磁片內的檔案複製抄寫到光碟片或隨身碟等媒體。
優點:簡單方便。
缺點:無法解決電子檔案格式過時的問題。
常見保存方法-更新
-
25
轉置(Migration):根據Commission on Preservation and
Access(CPA)及Research Libraries Group(RLG)的研究
報告-轉置是指定期將數位資源從舊有的軟體或硬體上轉移
到新的,或是從舊有的電腦科技轉移到新的電腦上。其定義
涵蓋了「更新refresh」媒體以及「轉移migration」系統兩
種概念。
機關電子檔案管理作業要點-轉置係指電子檔案之軟硬體過
時或失效,需進行軟硬體格式轉換,以便日後可讀取之作業
程序。
常見保存方法-轉置
-
26
特點:
改變原始電子檔案格式的結構。
因應資訊科技環境的變化,仍能有效讀取檔案內容。
目前在國際間最常被使用的方法。
例:WDLTIFF或、DOC TIFF或PDF。
Unix Linux、C語言Java語言
缺點:
轉置過程易有錯漏。
轉置過程產生的錯漏資料,會被無限繁衍。
需輔以人工檢核,當進行大量檔案轉置作業時,造成檢核的
困難。
常見保存方法-轉置
-
27
27
電子檔案保存格式
摘自機關檔案管理資訊化作業要點附件九
類型 格式 說明
文字檔 XML
一、開放性標準。
二、電子公文傳遞交換格式。
PDF 一、業界認定可攜性文件格式。
二、文書及檔案管理電腦化作業規範所訂文字檔格式。
圖片檔 JPEG 一、如檔案係以影像掃描製作,一律採全彩,壓縮品
質為75%以上 ,解析度300 DPI以上。
二、開放性標準。
聲音檔
MP3 開放性標準。
WAV 一、開放性標準。
二、文書及檔案管理電腦化作業規範所訂聲音檔格式。
視訊檔
MPEG-2 一、開放性標準。 二、文書及檔案管理電腦化作業規範所訂動態影像
檔格式。
AVI 專屬軟體。
-
28
28
類型 格式 說明
工程圖檔
IGES 美國國家標準(ANSI Y14.26M)。
DXF 開放性標準。
STEP 國際標準(ISO/IEC10303)。
文字影像檔
JPEG 一、彩色影像:採全彩,壓縮品質為75%以上,解析度200 DPI以上。
二、開放性標準。
TIFF 灰階影像:採解析度200 DPI以上。
TIFF 一、黑白影像:採CCITT G4標準,解析度300 DPI以上。
二、業界認定開放性標準。
PDF 業界認定可攜性文件格式。
WDL 國內開發之可攜性文件格式。
PNG 一、索引色影像:採256色ZIP非破壞性壓縮,解析度300DPI以上。
二、線上簽核使用追蹤修訂功能時,採用本格式產生簽核頁面。
數位墨水 ISF
一、 手寫簽核資料採用本格式以筆跡方式存檔。
二、 筆跡檔案業界認定開放性標準。
-
29
模擬(Emulation):於現有的技術環境下,將數位資料回復其
原始作業環境,藉以呈現原有資料。
模擬的方式可分為硬體模擬硬體、軟體模擬硬體及軟體模擬
軟體。 特點:
保留原始作業系統、應用軟體及環境,確保原始環境的真實性。
運行在虛擬機器的軟體,就被侷限在虛擬機器提供的資源中,
亦即它不能超出虛擬世界。
缺點:
模擬器的設計與建置不易,技術門檻高,成本亦高。
因應長期保存,模擬器仍需面臨再設計與轉置的問題。
實務上尚無真實應用案例,英國的JPC計畫、荷蘭的e-Depot
計畫仍屬計畫實驗階段。
常見保存方法-模擬
-
30
模擬架構圖
原始數位文件
原始應用軟體
原始作業系統
原始硬體
原始數位文件
原始應用軟體
原始作業系統
模擬器
未來作業系統
未來硬體
常見保存方法-模擬
-
31
From:Modular emulation as a long-term preservation strategy for digital objects,
(摘自:數位物件長期保存策略之模擬器模組) http://www.iwaw.net/05/papers/iwaw05-hoeven.pdf
堆疊式模擬(Stacked emulation)
2005年原始環境
2005年原始環境
2010年 原始環境
2015年環境
Time 2005年 2010年 2015年
應用軟體
作業系統
硬體平台
模擬器
-
32
From:Modular emulation as a long-term preservation strategy for digital objects,
(摘自:數位物件長期保存策略之模擬器模組) http://www.iwaw.net/05/papers/iwaw05-hoeven.pdf
轉移式模擬(Migrated emulation)
Time 2010年 2015年
2005年原始環境 2005年原始環境
編譯器 模擬器
產生
作業系統
硬體平台
-
33
封裝(Encapsulation):將電子檔案及銓釋資
料,以包裹方式儲存之。
特點:保留原始環境的資訊,亦即將電子檔案的內容、
架構與關聯性訊息都打包封存,目的在於保
存電子檔案的完整性,做為後續長久保存策
略的應用,確保使用者可以在持續改變的新
科技中繼續檢索與使用。
缺點:檔案大小只會長大不會變小,檔案愈大,效率
愈差。
常見保存方法-封裝
-
34
常見保存方法-封裝
檔案層 詮釋資料
文件一
文件二
文件三
文件層 詮釋資料
編碼一
編碼二
編碼三
封裝物件 詮釋資料
封裝物件
識別區塊
編碼層 詮釋資料
內文資料
封裝 檔案 文件 編碼
-
35
標準化(Standardization):將電子檔案格式朝向簡單化、
開放式、標準化訂定,建立國際標準,提供大家共同依循
使用。
列印成紙張(Converting to Paper),惟影音檔案則無法以紙本呈
現。
其他瀏覽媒體(Analog Media)如微縮處理
常見保存方法-標準化與其他
綜觀各類保存方法,各有特色,可解決的問題亦有
差別,現階段言,單一方法實難解決電子檔案的複
雜環境,惟有因應不同的狀況,各種方法相互搭配
運用,方能產生一套具體完整的長期保存策略。
-
36
電子檔案長期保存策略
-
37
國家檔案數位服務計畫
國家檔案數位服務計畫(97至100年)
發展電子檔案,傳承歷史紀錄
人力
經費
長期保存 長期安全 保存格式
專家顧問 團隊
監督
協調
軟體
設計
檔案資訊系 統驗證作業
導入
規定
電子檔案轉置模擬 暨
過時必備軟硬體典藏實驗室
電 子 檔 案 長 期 保 存 架 構 平 台
建置
應用
國 際 合 作 交 流
電 子 檔 案 法 規 研 修
電 子 檔 案 教 育 訓 練
電子檔案技術服務中心
-
38
價值及技 術鑑定
& 保存年 限檢視
檔案 保存年限 ≦10年
封裝(Encapsulation)+系統保存 (system Preservation) +複製作業 (Replication)
符合 電子檔案 保存格式
封裝+格式轉置(Format Migration) 例:文字檔、圖片檔、聲音檔、視訊檔、 工程圖檔、文字影像檔、數位墨水檔 等靜態格式
封裝+模擬(Emulation) 例: DB、Web、AP 、E-Mail等動態格式 檔案
電子檔案長期保存架構
電子檔案生成時,即進行metadata
著錄,並進行封裝;各類保存方式
互相搭配運作,產生完整策略。
否
是
是
否
-
39
電子檔案長期保存架構
符合
電子檔案 保存格式
預覽檔案
應用檔案
保存檔案
格式解析 轉換NAA 標準格式 格式庫
NAA 閱覽軟體
使 用 者
-
40
教 育 訓 練
國 際 合 作
成果應用 技術服務中心、
電子檔案線上百科系統
核心技術 電子檔案長期保存技術平台
基礎建置 電子檔案定義/格式/管理
法規修訂
電子檔案長期保存與相關管理技術規劃架構
轉置、模擬、技術保存(含軟、硬體)、標準化格式
檔案電子儲存管理辦法
機關電子檔案管理作業要點
機關檔案管理資訊化作業要點
諮詢服務、專家黃頁、查詢系統
數位課程、實體課程、研討會、焦點座談會
主辦國際研討會、參加國外研討會、參訪國外檔管機構
-
41
一、籌劃階段
•邀請專家學者,成立檔案資訊諮詢委員會,提供諮詢及
監督電子檔案長期保存架構平台建置案之執行。
•調查各機關數位化的檔案數量、格式及種類,擇定部分
機關進行實地訪談,俾瞭解電子檔案狀況及機關需求。
•探討國際間電子檔案發展趨勢、管理機制及相關技術。
•研析電子檔案生命週期及剖析電子檔案國際標準
(ISO15489),承接國際電子檔案長期保存研究成果。
•參訪、見習、參加國際相關研討會,吸取經驗及成果。
•成立電子檔案長期保存技術服務專案,加入民間專家顧
問及導入學界技術,協助建置作業。
執行程序
-
42
二、建置階段
•技轉多媒體資籵長久保存技術、老舊影像及影片數位化檔案內容
的修護技術,強化檔案內容的清淅辨識。
•針對各機關已無法開啟之檔案格式、數量、儲存媒體及作業方式
,研究規劃過時必備軟硬體、知識地圖及專家黃頁,整合電子檔
案百科系統,建立機關間共通交流平台。
•研究電子檔案儲存媒體、檔案格式、資訊安全及我國與國際間電
子檔案的差異性與需求,設計實作轉置機制。
•擇選機關進行電子檔案清理、銷毀、移轉(交)作業,評估檢討改
進。
•建置電子檔案長期保存實驗室,研發電子檔案保存及應用機制。
•建立電子檔案技術服務中心,提供諮詢及技術服務。
執行程序
-
43
三、營運階段
•規劃辦理宣導營運作業,技術服務中心正式對外服務。
•規劃辦理國內外電子檔案研討會及成果發表。
•辦理電子檔案教育訓練,強化機關檔案管理工作知能。
•研修電子檔案相關法規,評估移轉年限,強化技術鑑定
作為,訂定各類型檔案長期保存格式、環境及衍生之長
期安全議題。
•增加國際經驗交流、研討及合作機會,隨時引入國外先
進技術、法規及經驗。
•訂定追蹤評估機制,建立追蹤紀錄、定期稽核、評估改
進及調整作業方式。
執行程序
-
44
謝謝聆聽,敬請指教