作者:大檔家時間:2020-10-30
1.預處理
預處理(也稱為預處理)是構建數字檔案資源的第一步。它的主要內容包括選擇,計數,注冊,分類,清潔,恢復等。
識別和選擇是指根據指定原則和方法,根據檔案數字化的目的對數字化對象進行識別和選擇。僅需數字化和轉換滿足要求的物理檔案,包括紙質檔案,縮微膠卷,錄音,錄像和照片。要對要數字化的對象進行計數并按其規(guī)格和數量進行登記,并應進行必要的整理,清潔和維修,以便對要數字化的物理文件及其目錄進行整理,從而為進行數字化做好了充分的準備。接下來的數字轉換,并提供可以直接數字化的標準化目錄數據和實體。工作的具體內容包括目錄的規(guī)范,完成和更正,以及對歸檔實體的清除,驅蟲,拆包,分類和恢復。應當指出,在進行數字處理之前,還應修復舊的音頻和視頻磁帶。電聲指數下降,磁粉脫落,發(fā)霉,粘附等現象在舊磁帶中很常見,這會影響它們的正常播放和原始錄制信號的提取。必要的維修,清潔和加固處理可以確保正常的播放操作并獲得高質量的信號源。
2.數字處理/轉換
數字處理/轉換的主要內容是通過模數轉換技術和設備將傳統載體中記錄的檔案信息轉換為以數字形式表示的信息資源。不同類型的物理文件,ANALOg到數字的轉換技術和設備各不相同。紙質文件,經過數字處理的照片主要用于掃描儀,數碼相機等要掃描或照相的設備,縮微膠片數字化主要用于要掃描的縮微膠片掃描儀。錄音文件的數字設備主要是音頻采集卡,錄音文件的數字設備主要是視頻采集卡。錄音和錄像的輸出設備通過特定的音頻和視頻傳輸線連接到音頻采集卡和視頻采集卡,并且音頻采集卡和視頻采集卡安裝在計算機上。
此階段的關鍵問題是相關技術參數的選擇。選擇技術參數時應考慮三個要求:
(1)原始信息的保真度,數字信息應盡可能清晰準確,以再現原始文件的外觀。
(2)方便用戶。數字信息應易于傳輸和瀏覽,以滿足不同用戶的操作需求。
(3)保護原始文件。數字處理應確保原始文件,尤其是瀕臨滅絕的文件不被損壞。
這些要求可能是矛盾的,例如從歸檔的角度來看數字失真低,失真越小,計算機文件容量越大;從利用率的角度來看,大容量文件傳輸速度較慢。通過積極吸收成熟,穩(wěn)定的國際和國內標準,指南和手冊的規(guī)定和建議,并掌握對數字信息資源的利用和管理的需求,這將有助于提高數字處理的水平。
3.信息處理
信息處理是指對數字圖像和多媒體信息進行適當的處理以滿足使用的需要。具體工作包括檢查(針對原始文件),壓縮,邊緣去除,去污,噪聲去除,干擾去除,使用光學符號識別(OCR)技術來識別圖像中的文本,使用矢量技術進行轉換將光柵圖像轉換為矢量圖形等。如有必要,它也可以嵌入數字水印,以保護數字檔案資源的知識產權。
4.信息組織
信息組織負責建立機器可讀的目錄和索引,創(chuàng)建目錄,全文,多媒體和其他數據庫,并將數字信息(圖像,文本,音頻,視頻等)與目錄和索引信息聯系起來。
如果在數字化處理之前已經建立了有機閱讀目錄,則需要補充一些必要的記錄項目,例如數字化文件信息資源的計算機文件名,存儲位置,格式等;一些必要的描述性項目,例如關鍵字和摘要,也可能需要修訂和完善。編目是檔案情報控制的一種手段。機器可讀編目中編目的質量與檢查和維護數字檔案信息的難度有關。它一直是理論和實踐關注的焦點,而編目標準化是重中之重。對于具有研究價值的歷史檔案信息,現階段可能需要進行必要的研究工作,例如對人的姓名和地名信息進行文字研究,并記錄文字研究結果和文字研究基礎資料。
5.信息存儲
信息存儲是指為數字檔案及其目錄信息選擇適當的存儲介質,存儲模式和存儲架構。數字檔案信息資源的存儲要求和存儲方法與電子文件基本相同。
6.信息服務
易于傳輸和使用是數字信息的特征之一,在更大范圍內為更多用戶提供更及時,更滿意的服務也是檔案館數字化的基本力量。綜合檔案館的數字館藏屬于公共范圍,建議通過互聯網網站將其發(fā)布給公眾,并提供給在線使用。內部用戶應通過內部網絡共享檔案的數字信息。負責公共服務的機構還應考慮通過在線查詢和就地查看向公眾提供服務。
具體的使用方式取決于收集的具體情況。目前,國內外許多數字圖像的在線服務是提供免費的在線目錄搜索和瀏覽小尺寸和低分辨率的圖像,而原始尺寸和高分辨率的圖像需要申請付費使用。數字化手段大大提高了檔案館的服務能力和響應速度,部分檔案館達到了商業(yè)組織的服務水平。
7.信息維護
數字化檔案及其目錄信息應保存很長時間,并應保持其完整性,可讀性和可用性以保護投資價值。數字檔案信息資源的維護要求和維護方法與電子文件基本相同。
2021-09-13
2021-09-13
2020-11-30
2020-11-27
2020-11-26