网站作为企业或者政府机构发布信息以及对外提供服务的重要窗口,在使用中会形成大量的具有凭证以及查考价值的网页信息内容,需要通过网页归档软件将这些网页信息内容及时进行归档以及安全的保存起来。那么,高性能的网页归档软件在对网页信息进行归档时要注意哪几个信息收集要点呢?
第1.制定合理的收集时间
网页归档应该合理的设置网页信息收集时间,例如,网站首页或栏目页可在展现形式发生较大变化时对其中的信息给予收集归档、信息发布类的页面要在网页信息发布或者更新之时给予收集、解读回复类页面要在解读回应完成以后进行收集。另外当各个页面发生了较大变化时应该及时给予信息收集。
第2.收集的信息内容要完整
网页归档之时应该将网页信息都完整的收集起来,但是在一般情况下,只收集本网站内的网页信息,网页信息收集时,应完整收集页面中那些可视静态内容,包括文本和静态图片等,此外,页面中的动画、音视频、脚本以及URL等内容在保证真实性、可用性以及安全性的情况下也可以进行收集。
第3.附件要和页面一起收集
对于有附件的页面,网页归档时要将附件与页面作同时收集起来,此外,当一项内容因为篇幅较长而分为多个页面来显示时,应该将该项内容所对应的多个页面一起收集起来。
利用高性能的网页归档软件对网页进行信息内容归档之时,需要对网页中的各项内容进行收集,而在收集时一定要注意这几个要点。只有做好充分和完整的收集才能做好网页归档工作,将网页中的各种重要信息内容都收集并进行归档。