了解德国国家图书馆的数字化的努力在法兰克福,德国



成绩单

旁白:德国国家图书馆在法兰克福,德国的中心存档。几乎所有曾经被写和发表在德国是编目。目前,一个好的图书馆2300万这样的文本文件。德国所有出版物超过五页,打印至少10份分配进入金库。

STEPHAN JOCKEL:“有些出版物我们不继续文件,因为他们中扮演微不足道的角色保护德国写的文化遗产。这包括诸如电话簿和列车时刻表。基本上任何纯粹的商业交易细节的文档或基本的交通运输物流。”

旁白:与时俱进,德国国家图书馆过渡到数字档案。事实上,它甚至德国互联网上存储数据安置。但就目前而言,只有有限的资源像在线论文被存档。图书馆,然而,很快就会开始着手收集互联网发表在德国的一切,包括博客和用户论坛。现代web-harvesting技术是完成任务的关键。

JOCKEL:“网络收获是使用专门的网络爬虫收集数据。我们进入到履带的特定条件,如德国顶级域名.de和存档供以后检索相应的信息。”

旁白:即使在今天,大量的数据流已经流入德国国家图书馆的地下室。数据处理器必须归档范围广泛的材料发表的数据存储设备。一个难以置信的服务器数量必须在图书馆的管理网络,以完成工作。

此外,图书馆必须确保出版物很容易访问和可读甚至几年。在这里,例如,一个过时的Commodore 64项目从1986年是现代Windows操作系统上运行。有两种方法可以得到这样的软件在现代的机器上运行,仿真和数据迁移。

JOCKEL:“模拟是一个新的计算机系统的能力表现得像一个年长的操作系统,允许旧文件被打开或过时的程序运行。迁移是相反的,它将数据或文档本身,以便它可以直接阅读的新操作系统和显示在当前格式。”

旁白:今天,越来越多的书籍数字化,包括扫描他们的页面。这样做的明显的优势是,网上出版物是通过图书馆目录和年龄的增长,脆弱的书可以更好地保存下来,因为它们不需要检查。如今,许多人喜欢阅读屏幕书,改变海关的一个标志。但是不管将来什么,德国国家图书馆将准备接受挑战。