论文首页哲学论文经济论文法学论文教育论文文学论文历史论文理学论文工学论文医学论文管理论文艺术论文 |
本方法主要涉及以下四方面知识:html语言、http协议、winsock编程、多线程程序设计。
程序实现过程:
1.分析链接关系(限于篇幅,这里只介绍对锚标记〈a〉的分析)。
在html中〈a〉标记的基本语法为:〈a href=″...″ name=″...″ target=″...″〉。其中参数href的值就是欲获取的url值。
2.下载。
在http协议中常用的请求方法有两种:get和post。本实现使用get方法。最简化的get请求包如下:
get /index.htm http/1.1
“/index.htm”表示客户端欲下载的文件路径;“http/1.1”表示协议版本。
程序生成get请求包,在成功连接对应web服务器的80或其它端口后,使用基于tcp协议的同步模式套接字发送请求包并等待返回信息。
服务器将返回一个应答包,大致如下:
http/1.0 200 ok
...
第一行是应答信息。如果成功,服务器将返回“http/1.0 200 ok”。
第三行是一个空行,用以分隔http包头和包体(数据)。
第四行开始就是以字节流的方式返回的数据。
如果使用http代理,则与上述有两点不同。
第一, 连接时应连接代理服务器,而不是连接web服务器。
第二,在生成请求包时,下载文件的url必须写全url。对上例而言,请求应为“get http://netsport/index.htm http/1.1”,而不是“get /index.htm http/1.1”。
具体程序和类(程序使用delphi3.0编制):
1.初始化winsock。
procedure tform1.formcreate(sender: tobject);
var
wversionrequired: word;
下一页