基于PDF文档的网络学习资源建设网络(2)
2014-04-11 01:05
导读:二、PDF文档的结构 PDF文档的组成,有三个层次: ● 内容层。包含文件中所有文字和图象的内容。 ● 基本信息层。包含有关文件的基本信息,如
二、PDF文档的结构
PDF文档的组成,有三个层次:
● 内容层。包含文件中所有文字和图象的内容。
● 基本信息层。包含有关文件的基本信息,如字体信息、导航器引用表等。
● 增强信息层。包含增强功能的信息,如超文本链接、书签内容、文章信息等。
在PDF文档中包含了一种数据存贮格式FDF(Form Data Format),处理于表单域数据输出和导入,是一种纯文本文件。PDF文件由文件头、文件主体、交叉引用表、文件尾四个部分组成。
FDF文件头的首行表明了当前文件所使用的FDF规范版本。
FDF文件主体主要由catalog对象组成。Catalog对象仅含一个关键字FDF。关键字FDF的值包含如下项目:
Fields:包含一组域属性的定义
F:指定Form输出或导入数据的PDF文件名等
项目Fields的属性定义包含下列描述:
T:域名
V:域值
OPT:选择项域的各项值等
PDF文件尾由关键字trailer间接引用FDF文件体的catalog对象关键字root的一个值对及文件结束标记%%EOF组成。
PDF文档是通过一系列对象序列来构造的。PDF对象包括直接对象和间接对象,间接对象是经过标识了的PDF对象,直接对象通常有布尔型、数值型、字符串型、名字型、数组型、字典型、空对象、流对象等基本类型。一个PDF文档包含了一个以上的页面,而每一个页面都可以包含文档、图形图象,继而加入声音和动画。在多媒体信息的组合上,完全将多种媒体信息融会在一起。
(科教论文网 lw.nseaC.Com编辑发布) 三、PDF文档与Web数据库
PDF文档的表单是PDF页面控制的对象,也是PDF向Web数据库进行数据信息传递的接口,还可以向Web数据库读取相应数据。表单的域、字段变量都能和Web数据库建立数据通道。通常Web数据库接受来自客户端的数据一般都采用CGI程序实现。开发CGI程序的语言工具众多纷繁。PDF文档作为目前电子文档的一种通用格式,其中提供的和Web数据库接口的内部结构域和字段变量,大大增强了它在互联网上的使用。我们在构建PDF文档携带的多媒体网络信息资源过程中,借助了ASP技术向Web上发布PDF,同时接受来自客户端的交互数据。
1. PDF文档表单向Web数据库提交数据
在Adobe Acrobat 4.0 PDF开发环境中,构造一个学习者登录注册(以学习者注册信息为例)信息表单的PDF文档,文件名为Login.pdf,表单中各域名与Web数据库字段名一一相对应起来。如图所示:(略)
表单中,按钮“注册”通过鼠标事件Mouse Up驱动行为Submit form实现向服务器应用程序传递参数信息。在定义Submit form行为时,保持服务器应用程序的URL和提交信息的ASP程序相一致。输出格式为HTML form(URL encoded),选择输出的表单域的域名。
在服务器的ASP应用程序中,利用VBScript语句Request来获取PDF文档表单域的域名参数信息,书写格式为:
Request(“field_name”)
对于接受到的PDF文档的表单数据,将通过ODBC驱动熥⑷耄祝澹馐据库中。服务器中的ASP程序关键代码如下:
大学排名 <% d1= Request(“name”)%><%=d1%>
data.path=server.MapPath煛埃欤铮纾椋睿mdb”
set conn=server.createObject煛埃粒模希拢牛Connection”