第 七 章
HTTP协议
Zhang Dongyan TCP/IP Protocols 2
Http简介
?现在在 internet中使用最广的莫过于 HTTP
协议了,也就是超文本传输协议,目前版本
主要为 HTTP ver1.1为标准。
?在 HTTP协议中,服务端是指提供 HTTP服务
的部分,客户端是指你使用的浏览器或者下
载工具等等。
?在通讯时,由客户端发出请求连接,服务端
建立连接;然后,客户端发出 HTTP请求
( Request),服务端返回响应信息
( Respond),由此完成一个 HTTP操作。
Zhang Dongyan TCP/IP Protocols 3
HTTP协议的主要特点
① 支持客户 /服务器模式。
② 简单快速:客户向服务器请求服务时,只需传送
请求方法和路径。请求方法常用的有 GET、
HEAD,POST。每种方法规定了客户与服务器联
系的类型不同。
– 由于 HTTP协议简单,使得 HTTP服务器的程序规模小,
因而通信速度很快。
③ 灵活,HTTP允许传输任意类型的数据对象。正
在传输的类型由 Content-Type加以标记。
④ 无连接:无连接的含义是限制每次连接只处理一
Zhang Dongyan TCP/IP Protocols 4
个请求。服务器处理完客户的请求,并收到客户的应答
后,即断开连接。采用这种方式可以节省传输时间。
5 无状态,HTTP协议是无状态协议。无状态是指协议
对于事务处理没有记忆能力
Zhang Dongyan TCP/IP Protocols 5
http协议规范
?HTTP协议的内部操作过程分四个过程,
建立连接、发送请求信息、发送响应信息、
关闭连接。
Zhang Dongyan TCP/IP Protocols 6
H T T P / 1, 0报文有两种类型:请求和响应。
H T T P / 1, 0请求的格式是:
re q u e s t - l i n e
headers ( 0或有多个 )
<blank line>
body (只对 P O S T请求有效 )
re q u e s t - l i n e的格式是:
request request-URI HTTP版本号
Zhang Dongyan TCP/IP Protocols 7
支持以下三种请求:
1) G E T请求,返回 re q u e s t - U R I指出任意信息。
2) H E A D请求,类似于 G E T请求,但服务器程序只
返回指定文档的首部信息,而不包含实际的文档内容。
该请求通常被用来测试超文本链接的正确性、可访问
性和最近的修改。
3) P O S T请求用来发送电子邮件、新闻或发送能由交
互用户填写的表格。这是唯一需要在请求中发送 b o d y
的请求。使用 P O S T请求时需要在报文首部 C o n t e n
t - L e n g t h字段中指出 b o d y的长度。
Zhang Dongyan TCP/IP Protocols 8
H T T P / 1, 0响应的格式是:
s t a t u s - l i n e
headers ( 0个或有多个 )
<blank line>
b o d y
s t a t u s - l i n e的格式是:
H T T P版本号 response-code re s p o n s e - p h r a s e
Zhang Dongyan TCP/IP Protocols 9
首部字段
H T T P / 1, 0的请求和响应报文的首部均可包含可
变数量的字段。用一个空行将所有首部字段与报文主体
分隔开来。一个首部字段由字段名和随后的冒号、一个
空格和字段值组成,字段名不区分大小写。
报文头可分为三类:一类应用于请求,一类应用于
响应,还有一类描述主体。有一些报文头 (例如,D a t e)
既可用于请求又可用于响应。描述主体的报文头可以出
现在 P O S T请求和所有响应报文中。下图列出了 1 7种
不同的报文头。未知的报文头字段将被接收者忽略。
Zhang Dongyan TCP/IP Protocols 10
HTTP报文首部的名称
Zhang Dongyan TCP/IP Protocols 11
响应代码
服务器程序响应的第一行叫状态行。状态行以
H T T P版本号开始,后面跟着 3位数字表示响应代
码,最后是易读的响应短语。下图列出了 3位数字
的响应代码的含义。根据第一位可以把响应分成 5
类。
Zhang Dongyan TCP/IP Protocols 12
HTTP 3位响应码
Zhang Dongyan TCP/IP Protocols 13
各种报文头举例
Zhang Dongyan TCP/IP Protocols 14
? 在 G E T请求中指出版本 1, 0。
? 发送一个可以被服务器记录的简单的报文头,F
r o m。
? 服务器返回的状态行给出了版本号、响应代码 2 0
0和响应短语, O K”。
? D a t e报文头给出服务器上的时间和日期,通常
是格林尼治时间。上例中服务器返回一个老式时间
串。推荐的格式应是:缩写的天,日期中不含连字
符,4位数的年,如:
Zhang Dongyan TCP/IP Protocols 15
? 服务器程序类型和版本号是,NCSA Server版本 1.3。
? MIME版本是 1, 0。在卷 1的 2 8, 4节和 [Rose 1993]中
有较多关于 M I M E的内容。
? 报文体的数据类型由 C o n t e n t - T y p e和 C o n t e n
t - E n c o d i n g字段指出。 C o n t e n t -T y p e指出的
是类型,类型后跟一 ‘ /’,然后是子类型。本例中类型
是 i m a g e,子类型是 g i f。
Zhang Dongyan TCP/IP Protocols 16
其他的典型值是:
如果报文主体是经过编码的,则 C o n t e n t - E n c
o d i n g报文头也会出现。例如:如果返回的报文
中含有经过 U n i x的 c o m p r e s s程序压缩的 P o s
tSc r i p t文件 (通常带有, p s, Z后缀 ),下面的两种
报文头会同时出现:
Zhang Dongyan TCP/IP Protocols 17
? L a s t - M o d i f i e d指出了最后一次修改资源的
时间。
? 图象文件的长度 (2 859字节 )在 C o n t e n t - L e n g
t h报文头中指出。
在最后一个响应报文首部的后面,服务器程序紧跟
着图象后发送了一个空行。 U s e r - A g e n t是公用
的客户程序报文头,它用来标识客户程序的类型。
下面是一些公用报文头的例子:
Zhang Dongyan TCP/IP Protocols 18
例子:客户程序缓存
许多客户程序根据获取文件中的日期和时间在
硬盘上缓存 H T T P文档。如果客户程序要获取的文
档已存储在客户程序的缓存中,则客户程序将发送 I
f - M o d i f i e d - S i n c e 报文首部。
这样,如果服务器程序发现该文档没有发生任
何变化,就无需再发送一次该文档了。这称为条件
G E T请求。
Zhang Dongyan TCP/IP Protocols 19
上例中响应报文的响应代码为 3 0 4,它表示文档没有
变化。从 T C P协议来看,这样做避免了将文档的主
体 (上例中是一个 2 859字节的 G I F图象 )从服务器程
序传送给客户程序。但是余下的 T C P连接的开销 (三
次握手、终止连接的四个分组 )还是必须的。
Zhang Dongyan TCP/IP Protocols 20
Zhang Dongyan TCP/IP Protocols 21
Zhang Dongyan TCP/IP Protocols 22
Zhang Dongyan TCP/IP Protocols 23
Zhang Dongyan TCP/IP Protocols 24
Zhang Dongyan TCP/IP Protocols 25
Zhang Dongyan TCP/IP Protocols 26
Zhang Dongyan TCP/IP Protocols 27
Zhang Dongyan TCP/IP Protocols 28
WWW –– 信息海洋
Zhang Dongyan TCP/IP Protocols 30
WWW的基本概念
?环球信息网
?Web服务器与浏览器
?统一资源定位器
Zhang Dongyan TCP/IP Protocols 31
1,WWW( WORLD WIDE WEB,
环球信息网)
2、超文本
3、超媒体
4,WWW的基本特点
5,WWW的应用领域
1、环球信息网( WWW)
Zhang Dongyan TCP/IP Protocols 32
?浏览器 /服务器
?WEB服务器
?统一资源定位器( URL,Universal
Resource Locater)
?HTTP( Hyper Text Transport Protocol,
超文本传输协议)
?IE浏览器
2、环球信息网( WWW)
Zhang Dongyan TCP/IP Protocols 33
– 采用 C/S结构,双向数据通信和信息收集
– 采用 TCP/IP协议
– 能理解 HTML语言
– 通过 URL进行文档和资源的访问
– 允许客户机程序访问各种多媒体信息系统:文字、图
象、声音
– 信息资源丰富:电子百科全书
– 广域性:跨越国界的信息系统;
– 交互性:输入查询条件查询
– 分散性:信息分散存放;动态性:可随时修改
3,WWW 的特点
Zhang Dongyan TCP/IP Protocols 34
全球信息网、万维网,3W,Web
World Wide Web (世界范围蜘蛛网 )
4,WWW的连接
Zhang Dongyan TCP/IP Protocols 35
?超文本和超媒体 ( Hypertext&Hypermedia)
?超文本, 是指一种基于计算机的文档,各文档
之间互相链接,使信息可以交互查询。采用一种
非线形阅读方式
?超媒体,是超文本与多媒体的简单组合
– 浏览器 /服务器工作模式 ( Browser/Server)
A B
C D
5,WWW中的文档
Zhang Dongyan TCP/IP Protocols 36
浏览器 /服务器 (Browser/Server)体系结构
Internet
Web
Server Browser链接请求
网页
HTTP
6,WWW工作原理
Zhang Dongyan TCP/IP Protocols 37
?Web浏览器访问 Web服务器
Web
Server
Web
Browser
Internet
7,WWW怎样工作?
Zhang Dongyan TCP/IP Protocols 38
指 WWW客户软件,指客户端的 WWW浏览程序。
?作用
– 发出用户请求
– 接收、显示网页
?WWW的客户端软件
?常用的浏览器
– Internet Explorer,IE (Windows)
– Netscape (Unix,Windows)
– Mosaic (Unix,Windows)
– HotJava
8,Web 浏览器( Browser)
Zhang Dongyan TCP/IP Protocols 39
?用户要访问 WWW,必须在它的计算机上运
行 WWW客户软件。
?WWW浏览器软件的执行原理是, 将 WWW上
找到的内容在用户计算机上进行解释和显示。
?大多数的浏览器具备访问 Internet上其它服务
器的功能。 如 FTP,Gopher,WAIS等。
?有的浏览器还可以自动调用其他应用程序,
以显示特殊类型的文挡。
9,WWW 浏览器软件
Zhang Dongyan TCP/IP Protocols 40
网页
( WebPage)
主页
(HomePage)
10,IE浏览器的界面形式
Zhang Dongyan TCP/IP Protocols 41
超文本
(HyperText)
和超媒体
(HyperMediat)
11,HTML语言的信息描述方式
Zhang Dongyan TCP/IP Protocols 42
超文本标记语言 HTML:(HyperText Markup Language)
描述、建立超文本文档的语言。
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<title>哈尔滨工业大学 </title>
<meta name="GENERATOR" content="Microsoft FrontPage 3.0">
<base target="_top">
</head>
<body>
<table border="0" width="778" height="475" cellspacing="0" cellpadding="0">
<tr> <td width="100%"><p align="center"><font size="2" color="#0000FF" face="仿
宋 _GB2312"><a
href="noname.htm">课程设置 </a> <a href="xkjs.htm">系科介绍 </a><br>
<a href="noname">重点校外教学基地 </a></font></td> </tr>
</table>
</center></div>
</body>
</html>
12,HTML语言的描述语言
Zhang Dongyan TCP/IP Protocols 43
超文本传输协议( HTTP,Hypertext
Transport Protocol ),用于将 WWW服
务器的文档传送给浏览器的协议。
HTTP
Server
服务器
Browser
浏览器
数据
13,WWW使用的通信协议
Zhang Dongyan TCP/IP Protocols 44
Http://www.gdrtvu.edu.cn/index.html
协议名 主机名 文件名
210.38.32.2IP地址,
统一资源定位器
( URL,Universal Resource Locator)
14、统一资源定位器 URL
Zhang Dongyan TCP/IP Protocols 45
?URL(Uniform Resource Locator)
– URL完整地描述了 Internet上资源的地址,最多可以包
含 4个部分,如:
http://www.pku.edu.cn/academic/lesson.html
? ? ? ?
规则 机器名 文件 定位点
?描述 Internet上超媒体文档的地址,如:
– http://www.zsu.edu.cn
– ftp://ftp.zsu.edu.cn
– news://china.news
14、统一资源定位器
Zhang Dongyan TCP/IP Protocols 46
统一资源定位器
( URL,Universal Resource Locator)
网页地址的一般格式
<通信协议名 >://<主机名 (DNS/IP地址 )>:<端口 >/<目录 >/…/< 文
件名 >
例
http://www.pku.edu.cn/academic/lesson.html
http://162.105.129.12:80/
15、网页地址的格式
Zhang Dongyan TCP/IP Protocols 47
从一个网页进入另一个网页
(单击 文字、图形、标记等对象)
<a href="xkjs.htm">
系科介绍
</a>
<a href="yjs.htm" >
<img src="images/yjs.gif”
alt=“中澳合作招收研究
生” >
</a>
16、超 链接
Zhang Dongyan TCP/IP Protocols 48
?作用
– 管理信息文档
– 处理和响应用户请求
– 返回用户请求
?Web Server是驻留在服务器上的一个程序
?Server和 Browser之间通过 HTTP协议进行通讯
?最常用的 Web服务器
– Unix上的 CERN和 NCSA
– NT上的 Interent Information Server
– Windows 95/98上的 Personal Web Server
17,Web 服务器( Server)
Zhang Dongyan TCP/IP Protocols 49
?起始页 或主页 ( Home Page)
– 通过 WWW进行浏览时,一个网址的起始信
息页。
?网页 ( Web Page)
– 在 WWW中的每个页面( Web Page)。
18、其他
Zhang Dongyan TCP/IP Protocols 50
?安装 界面
?配置 使用
6.2 IE浏览器 的使用
Zhang Dongyan TCP/IP Protocols 51
?从 IE光盘中或从网络中下载
?执行,setup.exe
?安装 Window 9X/ME/2000/XP时
?可包含安装 IE
?所谓的“捆绑销售”
1、安装
Zhang Dongyan TCP/IP Protocols 52
2、启动 IE
Zhang Dongyan TCP/IP Protocols 53
菜单栏
工具条
URL地址栏
动态图标
浏 览 界 面
状态栏
Zhang Dongyan TCP/IP Protocols 54
?常规
?安全
?内容
?连接
?程序
?高级
3、配置
Zhang Dongyan TCP/IP Protocols 55
设置首页
Zhang Dongyan TCP/IP Protocols 56
?菜单操作
?工具条操作
?地址操作
?显示区操作
4、使用
Zhang Dongyan TCP/IP Protocols 57
?在知道具体 URL地址时
– 方法一:在, Location”处,输入 URL地址,回车。
– 方法二:用鼠标单击菜单, File”,单击, Open
Location”或单击窗口的, Open”按钮,即进入
,Location”画面。
– 方法三:按 ctrl+l 激活, Open Location”。
?不知道具体 URL地址时,或要查找某些特定的信息和
文件时,可通过网络搜索引擎查找。
5、浏览新页面
Zhang Dongyan TCP/IP Protocols 58
?文件菜单 ------新建 ------窗口
可同时浏览多个网址
?右击链接点 ------新建 -----窗口
打开新窗口浏览链接点,原窗口仍保
留
6、新建浏览窗口
Zhang Dongyan TCP/IP Protocols 59
?添加到收藏夹
收藏 菜单 -----添加收藏到夹
?整理收藏夹
7、收藏夹
Zhang Dongyan TCP/IP Protocols 60
?保存
– 页面保存:单击文件 |另存为
– 图象保存:右健点击图象 |Save image as
?打印
– 文件 | Page Setup打印纸张设置;
– 文件 | 打印页面。
?邮寄
– 文件 |发送 |电子邮件页面 。
8、保存、打印、邮寄页面
Zhang Dongyan TCP/IP Protocols 61
?文件菜单,包括文件存取和打印功能。
?编辑菜单,包括对文本的编辑和查找。
?查看菜单,包括重传当前页面和查看当
前页面源文件。
?工具菜单,包括各种设置和工具
?收藏菜单,包括添加、整理收藏夹
?帮助菜单,包括 Netscape公司通过网络
提供的各项帮助服 务。
9、菜单栏
Zhang Dongyan TCP/IP Protocols 62
?网页及其开发
?HTML语言简介
?HTML语言的结构
6.3 网页与 HTML语言简介
Zhang Dongyan TCP/IP Protocols 63
?HTML语言是超文本标记语言( Hyperlink
Text Markup Language)的缩写。它是一种
描述文档结构的语言,HTML语言使用描述
性的标记符(称为标签)来规定显示的信息
的格式或结构。
?用 HTML语言写的页面是普通的文本文档
( ASCII),不含任何与平台和程序相关的
信息,它们可以被任何文本编辑器读取。
1、什么是 HTML
Zhang Dongyan TCP/IP Protocols 64
?HTML特点
– 文件短小,易于传输和显示
– 独立于平台,多平台兼容
– 标记大多采用, 双边,,成对出现(前面的为头
标, Opening Tag”或开始标记,后面的为尾标
,Closing Tag”或结束标记,如 <title>This is a
title</title>
?局限性
– 标识的限制
– 格式编排不方便
?书写工具,HTML编辑器或其它文本编辑器
2,HTML 语言的特点
Zhang Dongyan TCP/IP Protocols 65
?是一种超文本标记语言;
?HTML文件是一个纯 ASCII(或纯文本)文件。
?HTML文件所描述的各种效果(如字体、字号、
颜色、格式、插图、声音、动画等信息),虽然
可以用字处理软件编辑,但必须在一特定的浏览
器软件下才能观看到。
2,HTML 语言的特点(续)
Zhang Dongyan TCP/IP Protocols 66
– Web站点,WWW(万维网) 是由许多 Web站点(网
站)组成,每个 Web站点其实就是一组精心设计的
Web页面,这些页面都围绕同一个主题,有机的连接
在一起,形成一个整体。
– Web页或网页,若将 WWW看成 Internet上的大型图
书馆,则每个 Web站点就是一本书,每个 Web页面就
是其中的一张书页,是网络文件的组成部分
– 主页或首页( Homepage),按上面的说法,主页就
是该书( Web站点)的封面和目录或是整个网站文件
的起始页。可从主页进入整个网站文件,开始对网站
进行浏览。主页又代表整个网站文件的地址。
– 网络文件,存放在网络服务器上的完整信息的集合体,
包含一个或多个网页。
3、几个常用术语和约定
Zhang Dongyan TCP/IP Protocols 67
?组成内容:
– * 文件的实际文字内容(如字母、数字、空格和标点
符号等)
– * 对该文件的格式和特性进行描述的 HTML说明(标
记)
?常用的标记有:
– * <HTML>… 文件全部内容 … </HTML> ;表示
HTML文件开始与结束,无属性。
– * <HEAD>… </HEAD> ; Web页面头部标记,其中
内容一般是整个文件的序言,除显示 <TITLE>中的内
容外,其它内容均不显示。无属性。
4,HTML语言的基本框架
Zhang Dongyan TCP/IP Protocols 68
?HTML文档由标签和文字组成 ;
?标签是一个用尖括号 < > 括起来的命令词,标
签往往成对出现 ;不同标签之间可以嵌套,但
不能交叉;
?文件一般以,htm或,html为扩展名;
?HTML标签规定 Web文档的逻辑结构,并且控
制文档的显示格式,大部分 HTML标签的形式:
〈 标签名 〉 相应内容 〈 /标签名 〉
?标签对大小写不敏感。
5,HTML的标签
Zhang Dongyan TCP/IP Protocols 69
?HTML文档结构分为:
- 文件头 <head>… </head>
- 文件体 <body>… </body>;
?文件头包括文档标题 <title>… <title>;
?文件头和文件体都嵌入在
<html>… </html>标签中。
6,HTML的基本格式
Zhang Dongyan TCP/IP Protocols 70
<html>
<head>
<title>.,,</title>
<meta>
</head>
<body>
.,,
</body>
</html>
文档标题
文档的主要内容
7,HTML的基本结构
Zhang Dongyan TCP/IP Protocols 71
?<TITLE>… Web页面名称 … </TITLE> ; 用来给 Web页
面命名。浏览时,这一名称显示在浏览器的标题栏内。
每一 Web页只能有一个。
?<BODY>… Web文件体的内容 … </BODY> ; 一定要包
含在 <HTML>… </HTML>标记之内。其中可以包含属
性,如,BACKGROUND=“背景图文件名, ;
BGCOLOR=“XXXX(背景颜色码,X为十六进制
数), ; TEXT=“XXXX(文本颜色码), ;
LINK=“XXXX(链接颜色码); VLINK=“XXXX(已
访问过的超链接颜色码)
? <Hx>… </Hx> ; 定义文件中各子标题的等级,以区分
不同章节,x=1~6,即共有 6级标题。
8,HTML语言的基本框架
Zhang Dongyan TCP/IP Protocols 72
?<A>… </A> ; 定义超链接,其中可包含属性,
属性可以为,HREF=“被链接的对象,,被链接
对象可以是另一 Web页、另一 Web站点的主页、
或自己的电子邮件地址、或进一步将图作为链
接点
?<FORM>… </FORM> ; 定义表单并可将用户在
浏览器端输入的各种数据传送给 Server端的 CGI
( Common Gateway Interface)程序。其中可
包含两种属性,METHOD=“GET/POST(选择
表单的传输协议),,以及 ACTION=“表单提
交时调用的 Server端程序, 。
8,HTML语言的基本框架(续)
Zhang Dongyan TCP/IP Protocols 73
除成对出现的标签外,还有一些是单标记的标签,主要有,
?<P> ;空行标记。 加入 P标记后,先空出一行,然后再从
下一行继续显示其后的文字。属性有:
ALIGN=RIGHT/CENTER/LEFT,分别表示向右 /中 /左
看齐。
?<BR> ; 换行标记。
?<IMG> ; 设定显示的图形。其属性有,SRC=图形文件
名,ALIGN=LEFT/RIGHT/MIDDLE/TOP/BOTTOM
(图形与文字的对齐方式),WIDTH=XXX和
HEIGHT=XXX(设定图形的宽度和高度)等。
?<META> ; 用于记录 HTML文件的相关信息,这些信息
不会显示在浏览器上。必须放在 <HEAD>,</HEAD> 之
间。
8,HTML语言的基本框架(续)
Zhang Dongyan TCP/IP Protocols 74
?基本概念理解
– HTML文件存放在 Web服务器的某个目录里
– 通过 WWW浏览器下载 HTML文件,并对文件中的
标记进行解释(即浏览)
?基本成分:标题、段落、列表、表格、图象
?简单网页形式,
标题
内容段落(列表、表格、图象等)
内容段落(列表、表格、图象等)
9,简单 HTML文件介绍 --概述
Zhang Dongyan TCP/IP Protocols 75
?基本构成
– 文件的内容部分
– HTML的标志部分
?标志书写格式:
– <标识名 >文件内容 </标识名 >
– 标识名通常写在 < >内
– 不区分大小写
– 也有单向标识,<标识名 >
10,简单 HTML文件介绍 --构成
Zhang Dongyan TCP/IP Protocols 76
?四个基本标识
– <html></html>标识
– <head></head>标识
– <title></title>标识
– <body></body>标识
11、建立 简单的 HTML文件
Zhang Dongyan TCP/IP Protocols 77
?HTML文件起始标识
?成对出现
?包含文件的全部内容
<html>
文件的全部内容
</html>
12,<html></html>标识
Zhang Dongyan TCP/IP Protocols 78
– 网页头部的标识
– 写在 <head></head>之间的内容,如果又写
在,title”标识中,表示该网页的名称,并
作为浏览器标题栏的名称,显示在此网页窗
口的最上方。如果不写在,title”标识中,
则成为正文的头部,显示在文本之前。
–, head”标识中的文本应当尽量简练。
13,<head></head>标识
Zhang Dongyan TCP/IP Protocols 79
?网页名称标识
?在浏览器中作为标题栏名称显示在该窗口
的上方。
?一个网页应只有一个网页名称
?,title”标识应包含在,head”标识之间
?,title”标识内应不含任何其他标识
?,title”标识宜短小
14,<title></title>标识
Zhang Dongyan TCP/IP Protocols 80
?,body”标识中放置网页的主体内容
?成对出现
?文件取名规则:
-以 htm或 html为后缀
-文件名中不可有空格和特殊字符
-在 UNIX系统中,注意大小写敏感
-取名保存后,可在浏览器中打开
15,<body></body>标识
Zhang Dongyan TCP/IP Protocols 81
?语言字符集信息标记
<meta http-equiv=“content-type”
content=“text/html;charset=gb2312”>
16、语言字符集信息
Zhang Dongyan TCP/IP Protocols 82
?子标题是用来区分内容的不同章节的,
浏览时会显示不同的大小字型
?HTML定义了六个级别的子标题
?书写格式为,<Hn>吉安电大简介
</Hn>
?n从 1到 6,字体越来越小
17、文件的子标题
Zhang Dongyan TCP/IP Protocols 83
?<pre></pre>---原样显示文本
?<p></p>---段落标识
?<br></br>--- 行中断标识
18、几个常用的 HTML标识
Zhang Dongyan TCP/IP Protocols 84
?<html></html>
?<head></head>
?<title></title>
?<body></body>
?<Hn></Hn>
?<pre></pre>---原样显示文本
?<p></p>---段落标识
?<br></br>--- 行中断标识
19、常用标记小结
Zhang Dongyan TCP/IP Protocols 85
? <A HREF=“…/file1.html”> 链 接到 file1 </A>
被连接文件名及其路径
起始标识 结束标识
使用 <A>标识连接一个 HTML文件( file1.htm)
20、建立超链接
Zhang Dongyan TCP/IP Protocols 86
其中 HREF属性域指定了待链接文件名及其路径。
使用相对路径时,以链接所在文件为基准,可以
包含上层目录名(用,.);也可以使用绝对路径
或 URL地址。
21,<A 标签为如下形式:
Zhang Dongyan TCP/IP Protocols 87
当你在浏览器中用鼠标单击“主菜单”文字时,
就会跳转到名为 menu.html的文件。
回到 <A HREF="../menu.html">主菜单 </A>
22、显示一个链接并在 IE中显示
Zhang Dongyan TCP/IP Protocols 88
?创建链接
?链接到另一页面
?链接到 WEB的文件
?链接到文档的指定位置
Zhang Dongyan TCP/IP Protocols 89
23、本地超链接
?本地连接
– 所有连接文件都在本地磁盘上,不必连接网络
– 本地机上要有浏览器和编辑器
?同一目录下的本地连接
– 只需写文件名,不需写路径
?不同目录下的本地连接
– 必须写明连接文件路径名
– 路径名的写法:相对路径和绝对路径
– 相对路径:以当前文件所在路径和字目录为起
点,进行相对的文件查找。
– 绝对路径:以绝对路径名进行文件查找,绝对
路径中的盘符后用, |”,而不用,,,
Zhang Dongyan TCP/IP Protocols 90
相对路径名 含义
href=“file.html” 本地当前路径下的文件
href=“files/file.html” 本地当前路径下被称为,files”
的子目录 下的名为 file.html的文件
href=“file/morefiles/file.html” 当前目录下的 file子目录下
的,morefiles”子目录下名为
file.html的文件
href=“../file.html” 本地当前目录的上一级子目录下名
file.html的文件
href=“../../file.html” 当前目录的上两级子目录下名为
file.html的文件
相对路径名及其含义
Zhang Dongyan TCP/IP Protocols 91
绝对路径名 含义
HREF=“/u1/my/file.html” file.html放在 u1目录下的
my子目录下
HREF =“d|/files/file.html” file.html放在 D盘的 files目录
下的 html子目录下
说明,1、路径名书写要遵循 UNIX操作系统的格式,路径
名与目录名要以,/”分隔。
2、相对路径与绝对路径的选择。
绝对路径名及其含义
Zhang Dongyan TCP/IP Protocols 92
<A HREF=“http://www.gdrtvu.edu.cn”>your
home page </A>
被连接文件名及其路径
起始标识
结束标识
远程文件的连接
24、网络超链接
Zhang Dongyan TCP/IP Protocols 93
?网络信息的特点及其分类
?搜索引擎
?多元搜索引擎
?搜索引擎的比较及其发展趋势
6.4 网络信息检索工具
Zhang Dongyan TCP/IP Protocols 94
1、网络信息的特点及其分类
?1、网络信息资源的特点
?Internet上的信息几乎涵盖了人文科学和自
然科学的各个领域。主要有以下基本特点:
?无限性:内容十分广泛。
?丰富多彩:不止局限于文本,还包括图形、
视频、动画、声音、图表等。
?纷繁无序:提供信息的机构数不胜数,信
息格式没有统一规范,信息分散无序,变
化更新的速度很快。
Zhang Dongyan TCP/IP Protocols 95
?1、网络信息资源的特点(续)
?廉价性:目前网络信息大多数是免费提供的。
?新颖性,Internet上提供了获取非出版信息
的丰富机会,许多是主流出版渠道之外的边
缘文献,内容很新。
?广泛性:扩大了人际交流范围,提供了更多
直接交流的机会。
?注意,网络信息不是传统信息资源的简单翻
版,也不可能取代传统的信息资源,是传统
信息资源的有力补充。
1、网络信息的特点及其分类
Zhang Dongyan TCP/IP Protocols 96
1、网络信息的特点及其分类
?2、网络信息的分类
– 可以从不同的角度对网络信息进行大致的分类:
– 按信息的提供者分:可分为个人提供的和组织
(政府和公司)提供的信息两大类。
– 按访问者的权限来分:可分为开放信息和保密
信息两大类。网上信息绝大多数是开放的。
– 按信息涉及的领域来分:可分为以下 5类:
? ①教育类信息;②文化类信息;③科研类信
息;④娱乐消遣类信息;⑤政策类信息。
Zhang Dongyan TCP/IP Protocols 97
1、网络信息的特点及其分类
?3、网络信息的检索工具
– 网络信息检索工具是指在 Internet上提供
信息检索服务的一类计算机系统,其检
索对象是 Internet上的各种网络信息。
Web检索工具主要可分为以下几种类型:
– ( 1)目录型检索工具,是按某种主题
分类体系编制的一种可供检索的等级结
构式目录。用户通过该目录体系的引导,
找到有关的信息。如 Yahoo!
( www.yahoo.com)、搜狐
( www.sohu.com)等。
Zhang Dongyan TCP/IP Protocols 98
1、网络信息的特点及其分类
?3、网络信息的检索工具
– 搜索引擎,使用自动索引软件来发现、收
集并标记网页,建立数据库。以 Web形式
提供给用户一个检索界面,供用户输入关
键词之类的检索项,代替用户在数据库中
查找出与其匹配的记录并返回结果,且按
其相关度排序输出。
– 多元搜索引擎,将多个搜索引擎集成在一
块,并提供一个统一的搜索界面,检索时,
自动将一个检索提问发给多个搜索引擎同
时进行检索。
Zhang Dongyan TCP/IP Protocols 99
搜索引擎( Search Engine)是一种利用网络自动搜索技
术,对网络资源进行标记,并为检索者提供检索的工具。
1、搜索引擎的特点
搜索引擎一般由自动索引软件生成索引数据库,
具有收录加工信息范围广、速度快,能及时向用户
提供 Internet中的新增信息,可直接输入关键词或
词组进行检索。但由于人工干预少,准确性较差,
检索结果中有许多冗余信息。
2、搜索引擎
Zhang Dongyan TCP/IP Protocols 100
2、搜索引擎的工作原理或过程
搜索引擎的工作过程主要包括:信息采集、存储、加工、
处理和输出等部分。
( 1)信息采集与存储,搜索引擎一般采用自
动方式收集和存储信息,利用某些自动跟踪索引软
件追寻 WWW上的链接向前搜索,找到 Web页并将其调
出,并自动给该 Web页的某些词或全部词作上索引,
形成目标摘要格式文件后,填入网络可访问的数据
库。
2、搜索引擎(续)
Zhang Dongyan TCP/IP Protocols 101
2、搜索引擎的工作原理或过程(续)
( 2)加工:信息索引的建立
信息采集和存储后,要建立索引查询系统,其
作用是决定索引的时空比、布尔逻辑操作、表达式
匹配、词语匹配、相关性排序等。建立信息索引就
是创建文档信息的特征记录,使检索者能快速地检
索到所需信息。
2、搜索引擎(续)
Zhang Dongyan TCP/IP Protocols 102
2、搜索引擎的工作原理或过程(续)
( 3)输出:相关性处理并建立索引界面
一般情况下,网上检索的结果十分庞大,使检索
者无法逐一浏览。故搜索引擎还要根据文件的相关
程度进行排列,将最相关的文件放在最前面。
搜索引擎确定相关性的方法主要有,①概率方法 ;;
②位置方法;③摘要方法;④分类或聚类方法。
2、搜索引擎(续)
Zhang Dongyan TCP/IP Protocols 103
3、搜索引擎的检索功能
( 1)一般检索功能
这是搜索引擎的最基本的作用。这些功能主要包
括:布尔逻辑检索( Boolean)、词组检索
( Phrase)、截词检索( Truncation)、字段检索
( Fields)等。一般来说,每种搜索引擎并非包含
了所有这些检索功能,而且每种搜索引擎对其中某
一功能的侧重和表现也不相同。
2、搜索引擎(续)
Zhang Dongyan TCP/IP Protocols 104
3、搜索引擎的检索功能
( 2)特殊检索功能
特殊检索功能包括:
?自然语言( Natural Language)检索
?多语种检索
?区分大小写的检索
2、搜索引擎(续)
Zhang Dongyan TCP/IP Protocols 105
4、常用搜索引擎介绍
? google( www.google.com)
? Yahoo!( www.yahoo.com 以及中文站点,cn.yahoo.com)
? Altavista( www.altavista.digital.com)
? Lycos( www.lycos.com)
? Hotbot( www.hotbot.com)
? Northen Light( www.nlsearch.com)
? 天网( e.pku.edu.cn)
? 网络指南针( www.compass.net.edu.cn)
? 悠游北京( www.goyoyo.com.cn)
? 百度搜索( www.baidu.com )
2、搜索引擎(续)
Zhang Dongyan TCP/IP Protocols 106
什么是多元搜索引擎
多元搜索引擎( Metasearch Engine,
Megasearch Engine或 Unified Search Engine)又
称集成式搜索引擎,是将多个搜索引擎集成在一起,
向用户提供一个统一的检索界面。并且将一个检索
提问同时发给多个搜索引擎同时检索多个数据库,
经过聚合、去除重复部分并输出检索结果。使用多
元搜索引擎可让用户省时、省力。
3,多元搜索引擎
Zhang Dongyan TCP/IP Protocols 107
( 1)使用简单化
( 2)内容复杂化
( 3)功能专业化
( 4)索引智能化
4、搜索引擎的发展趋势
HTTP协议
Zhang Dongyan TCP/IP Protocols 2
Http简介
?现在在 internet中使用最广的莫过于 HTTP
协议了,也就是超文本传输协议,目前版本
主要为 HTTP ver1.1为标准。
?在 HTTP协议中,服务端是指提供 HTTP服务
的部分,客户端是指你使用的浏览器或者下
载工具等等。
?在通讯时,由客户端发出请求连接,服务端
建立连接;然后,客户端发出 HTTP请求
( Request),服务端返回响应信息
( Respond),由此完成一个 HTTP操作。
Zhang Dongyan TCP/IP Protocols 3
HTTP协议的主要特点
① 支持客户 /服务器模式。
② 简单快速:客户向服务器请求服务时,只需传送
请求方法和路径。请求方法常用的有 GET、
HEAD,POST。每种方法规定了客户与服务器联
系的类型不同。
– 由于 HTTP协议简单,使得 HTTP服务器的程序规模小,
因而通信速度很快。
③ 灵活,HTTP允许传输任意类型的数据对象。正
在传输的类型由 Content-Type加以标记。
④ 无连接:无连接的含义是限制每次连接只处理一
Zhang Dongyan TCP/IP Protocols 4
个请求。服务器处理完客户的请求,并收到客户的应答
后,即断开连接。采用这种方式可以节省传输时间。
5 无状态,HTTP协议是无状态协议。无状态是指协议
对于事务处理没有记忆能力
Zhang Dongyan TCP/IP Protocols 5
http协议规范
?HTTP协议的内部操作过程分四个过程,
建立连接、发送请求信息、发送响应信息、
关闭连接。
Zhang Dongyan TCP/IP Protocols 6
H T T P / 1, 0报文有两种类型:请求和响应。
H T T P / 1, 0请求的格式是:
re q u e s t - l i n e
headers ( 0或有多个 )
<blank line>
body (只对 P O S T请求有效 )
re q u e s t - l i n e的格式是:
request request-URI HTTP版本号
Zhang Dongyan TCP/IP Protocols 7
支持以下三种请求:
1) G E T请求,返回 re q u e s t - U R I指出任意信息。
2) H E A D请求,类似于 G E T请求,但服务器程序只
返回指定文档的首部信息,而不包含实际的文档内容。
该请求通常被用来测试超文本链接的正确性、可访问
性和最近的修改。
3) P O S T请求用来发送电子邮件、新闻或发送能由交
互用户填写的表格。这是唯一需要在请求中发送 b o d y
的请求。使用 P O S T请求时需要在报文首部 C o n t e n
t - L e n g t h字段中指出 b o d y的长度。
Zhang Dongyan TCP/IP Protocols 8
H T T P / 1, 0响应的格式是:
s t a t u s - l i n e
headers ( 0个或有多个 )
<blank line>
b o d y
s t a t u s - l i n e的格式是:
H T T P版本号 response-code re s p o n s e - p h r a s e
Zhang Dongyan TCP/IP Protocols 9
首部字段
H T T P / 1, 0的请求和响应报文的首部均可包含可
变数量的字段。用一个空行将所有首部字段与报文主体
分隔开来。一个首部字段由字段名和随后的冒号、一个
空格和字段值组成,字段名不区分大小写。
报文头可分为三类:一类应用于请求,一类应用于
响应,还有一类描述主体。有一些报文头 (例如,D a t e)
既可用于请求又可用于响应。描述主体的报文头可以出
现在 P O S T请求和所有响应报文中。下图列出了 1 7种
不同的报文头。未知的报文头字段将被接收者忽略。
Zhang Dongyan TCP/IP Protocols 10
HTTP报文首部的名称
Zhang Dongyan TCP/IP Protocols 11
响应代码
服务器程序响应的第一行叫状态行。状态行以
H T T P版本号开始,后面跟着 3位数字表示响应代
码,最后是易读的响应短语。下图列出了 3位数字
的响应代码的含义。根据第一位可以把响应分成 5
类。
Zhang Dongyan TCP/IP Protocols 12
HTTP 3位响应码
Zhang Dongyan TCP/IP Protocols 13
各种报文头举例
Zhang Dongyan TCP/IP Protocols 14
? 在 G E T请求中指出版本 1, 0。
? 发送一个可以被服务器记录的简单的报文头,F
r o m。
? 服务器返回的状态行给出了版本号、响应代码 2 0
0和响应短语, O K”。
? D a t e报文头给出服务器上的时间和日期,通常
是格林尼治时间。上例中服务器返回一个老式时间
串。推荐的格式应是:缩写的天,日期中不含连字
符,4位数的年,如:
Zhang Dongyan TCP/IP Protocols 15
? 服务器程序类型和版本号是,NCSA Server版本 1.3。
? MIME版本是 1, 0。在卷 1的 2 8, 4节和 [Rose 1993]中
有较多关于 M I M E的内容。
? 报文体的数据类型由 C o n t e n t - T y p e和 C o n t e n
t - E n c o d i n g字段指出。 C o n t e n t -T y p e指出的
是类型,类型后跟一 ‘ /’,然后是子类型。本例中类型
是 i m a g e,子类型是 g i f。
Zhang Dongyan TCP/IP Protocols 16
其他的典型值是:
如果报文主体是经过编码的,则 C o n t e n t - E n c
o d i n g报文头也会出现。例如:如果返回的报文
中含有经过 U n i x的 c o m p r e s s程序压缩的 P o s
tSc r i p t文件 (通常带有, p s, Z后缀 ),下面的两种
报文头会同时出现:
Zhang Dongyan TCP/IP Protocols 17
? L a s t - M o d i f i e d指出了最后一次修改资源的
时间。
? 图象文件的长度 (2 859字节 )在 C o n t e n t - L e n g
t h报文头中指出。
在最后一个响应报文首部的后面,服务器程序紧跟
着图象后发送了一个空行。 U s e r - A g e n t是公用
的客户程序报文头,它用来标识客户程序的类型。
下面是一些公用报文头的例子:
Zhang Dongyan TCP/IP Protocols 18
例子:客户程序缓存
许多客户程序根据获取文件中的日期和时间在
硬盘上缓存 H T T P文档。如果客户程序要获取的文
档已存储在客户程序的缓存中,则客户程序将发送 I
f - M o d i f i e d - S i n c e 报文首部。
这样,如果服务器程序发现该文档没有发生任
何变化,就无需再发送一次该文档了。这称为条件
G E T请求。
Zhang Dongyan TCP/IP Protocols 19
上例中响应报文的响应代码为 3 0 4,它表示文档没有
变化。从 T C P协议来看,这样做避免了将文档的主
体 (上例中是一个 2 859字节的 G I F图象 )从服务器程
序传送给客户程序。但是余下的 T C P连接的开销 (三
次握手、终止连接的四个分组 )还是必须的。
Zhang Dongyan TCP/IP Protocols 20
Zhang Dongyan TCP/IP Protocols 21
Zhang Dongyan TCP/IP Protocols 22
Zhang Dongyan TCP/IP Protocols 23
Zhang Dongyan TCP/IP Protocols 24
Zhang Dongyan TCP/IP Protocols 25
Zhang Dongyan TCP/IP Protocols 26
Zhang Dongyan TCP/IP Protocols 27
Zhang Dongyan TCP/IP Protocols 28
WWW –– 信息海洋
Zhang Dongyan TCP/IP Protocols 30
WWW的基本概念
?环球信息网
?Web服务器与浏览器
?统一资源定位器
Zhang Dongyan TCP/IP Protocols 31
1,WWW( WORLD WIDE WEB,
环球信息网)
2、超文本
3、超媒体
4,WWW的基本特点
5,WWW的应用领域
1、环球信息网( WWW)
Zhang Dongyan TCP/IP Protocols 32
?浏览器 /服务器
?WEB服务器
?统一资源定位器( URL,Universal
Resource Locater)
?HTTP( Hyper Text Transport Protocol,
超文本传输协议)
?IE浏览器
2、环球信息网( WWW)
Zhang Dongyan TCP/IP Protocols 33
– 采用 C/S结构,双向数据通信和信息收集
– 采用 TCP/IP协议
– 能理解 HTML语言
– 通过 URL进行文档和资源的访问
– 允许客户机程序访问各种多媒体信息系统:文字、图
象、声音
– 信息资源丰富:电子百科全书
– 广域性:跨越国界的信息系统;
– 交互性:输入查询条件查询
– 分散性:信息分散存放;动态性:可随时修改
3,WWW 的特点
Zhang Dongyan TCP/IP Protocols 34
全球信息网、万维网,3W,Web
World Wide Web (世界范围蜘蛛网 )
4,WWW的连接
Zhang Dongyan TCP/IP Protocols 35
?超文本和超媒体 ( Hypertext&Hypermedia)
?超文本, 是指一种基于计算机的文档,各文档
之间互相链接,使信息可以交互查询。采用一种
非线形阅读方式
?超媒体,是超文本与多媒体的简单组合
– 浏览器 /服务器工作模式 ( Browser/Server)
A B
C D
5,WWW中的文档
Zhang Dongyan TCP/IP Protocols 36
浏览器 /服务器 (Browser/Server)体系结构
Internet
Web
Server Browser链接请求
网页
HTTP
6,WWW工作原理
Zhang Dongyan TCP/IP Protocols 37
?Web浏览器访问 Web服务器
Web
Server
Web
Browser
Internet
7,WWW怎样工作?
Zhang Dongyan TCP/IP Protocols 38
指 WWW客户软件,指客户端的 WWW浏览程序。
?作用
– 发出用户请求
– 接收、显示网页
?WWW的客户端软件
?常用的浏览器
– Internet Explorer,IE (Windows)
– Netscape (Unix,Windows)
– Mosaic (Unix,Windows)
– HotJava
8,Web 浏览器( Browser)
Zhang Dongyan TCP/IP Protocols 39
?用户要访问 WWW,必须在它的计算机上运
行 WWW客户软件。
?WWW浏览器软件的执行原理是, 将 WWW上
找到的内容在用户计算机上进行解释和显示。
?大多数的浏览器具备访问 Internet上其它服务
器的功能。 如 FTP,Gopher,WAIS等。
?有的浏览器还可以自动调用其他应用程序,
以显示特殊类型的文挡。
9,WWW 浏览器软件
Zhang Dongyan TCP/IP Protocols 40
网页
( WebPage)
主页
(HomePage)
10,IE浏览器的界面形式
Zhang Dongyan TCP/IP Protocols 41
超文本
(HyperText)
和超媒体
(HyperMediat)
11,HTML语言的信息描述方式
Zhang Dongyan TCP/IP Protocols 42
超文本标记语言 HTML:(HyperText Markup Language)
描述、建立超文本文档的语言。
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<title>哈尔滨工业大学 </title>
<meta name="GENERATOR" content="Microsoft FrontPage 3.0">
<base target="_top">
</head>
<body>
<table border="0" width="778" height="475" cellspacing="0" cellpadding="0">
<tr> <td width="100%"><p align="center"><font size="2" color="#0000FF" face="仿
宋 _GB2312"><a
href="noname.htm">课程设置 </a> <a href="xkjs.htm">系科介绍 </a><br>
<a href="noname">重点校外教学基地 </a></font></td> </tr>
</table>
</center></div>
</body>
</html>
12,HTML语言的描述语言
Zhang Dongyan TCP/IP Protocols 43
超文本传输协议( HTTP,Hypertext
Transport Protocol ),用于将 WWW服
务器的文档传送给浏览器的协议。
HTTP
Server
服务器
Browser
浏览器
数据
13,WWW使用的通信协议
Zhang Dongyan TCP/IP Protocols 44
Http://www.gdrtvu.edu.cn/index.html
协议名 主机名 文件名
210.38.32.2IP地址,
统一资源定位器
( URL,Universal Resource Locator)
14、统一资源定位器 URL
Zhang Dongyan TCP/IP Protocols 45
?URL(Uniform Resource Locator)
– URL完整地描述了 Internet上资源的地址,最多可以包
含 4个部分,如:
http://www.pku.edu.cn/academic/lesson.html
? ? ? ?
规则 机器名 文件 定位点
?描述 Internet上超媒体文档的地址,如:
– http://www.zsu.edu.cn
– ftp://ftp.zsu.edu.cn
– news://china.news
14、统一资源定位器
Zhang Dongyan TCP/IP Protocols 46
统一资源定位器
( URL,Universal Resource Locator)
网页地址的一般格式
<通信协议名 >://<主机名 (DNS/IP地址 )>:<端口 >/<目录 >/…/< 文
件名 >
例
http://www.pku.edu.cn/academic/lesson.html
http://162.105.129.12:80/
15、网页地址的格式
Zhang Dongyan TCP/IP Protocols 47
从一个网页进入另一个网页
(单击 文字、图形、标记等对象)
<a href="xkjs.htm">
系科介绍
</a>
<a href="yjs.htm" >
<img src="images/yjs.gif”
alt=“中澳合作招收研究
生” >
</a>
16、超 链接
Zhang Dongyan TCP/IP Protocols 48
?作用
– 管理信息文档
– 处理和响应用户请求
– 返回用户请求
?Web Server是驻留在服务器上的一个程序
?Server和 Browser之间通过 HTTP协议进行通讯
?最常用的 Web服务器
– Unix上的 CERN和 NCSA
– NT上的 Interent Information Server
– Windows 95/98上的 Personal Web Server
17,Web 服务器( Server)
Zhang Dongyan TCP/IP Protocols 49
?起始页 或主页 ( Home Page)
– 通过 WWW进行浏览时,一个网址的起始信
息页。
?网页 ( Web Page)
– 在 WWW中的每个页面( Web Page)。
18、其他
Zhang Dongyan TCP/IP Protocols 50
?安装 界面
?配置 使用
6.2 IE浏览器 的使用
Zhang Dongyan TCP/IP Protocols 51
?从 IE光盘中或从网络中下载
?执行,setup.exe
?安装 Window 9X/ME/2000/XP时
?可包含安装 IE
?所谓的“捆绑销售”
1、安装
Zhang Dongyan TCP/IP Protocols 52
2、启动 IE
Zhang Dongyan TCP/IP Protocols 53
菜单栏
工具条
URL地址栏
动态图标
浏 览 界 面
状态栏
Zhang Dongyan TCP/IP Protocols 54
?常规
?安全
?内容
?连接
?程序
?高级
3、配置
Zhang Dongyan TCP/IP Protocols 55
设置首页
Zhang Dongyan TCP/IP Protocols 56
?菜单操作
?工具条操作
?地址操作
?显示区操作
4、使用
Zhang Dongyan TCP/IP Protocols 57
?在知道具体 URL地址时
– 方法一:在, Location”处,输入 URL地址,回车。
– 方法二:用鼠标单击菜单, File”,单击, Open
Location”或单击窗口的, Open”按钮,即进入
,Location”画面。
– 方法三:按 ctrl+l 激活, Open Location”。
?不知道具体 URL地址时,或要查找某些特定的信息和
文件时,可通过网络搜索引擎查找。
5、浏览新页面
Zhang Dongyan TCP/IP Protocols 58
?文件菜单 ------新建 ------窗口
可同时浏览多个网址
?右击链接点 ------新建 -----窗口
打开新窗口浏览链接点,原窗口仍保
留
6、新建浏览窗口
Zhang Dongyan TCP/IP Protocols 59
?添加到收藏夹
收藏 菜单 -----添加收藏到夹
?整理收藏夹
7、收藏夹
Zhang Dongyan TCP/IP Protocols 60
?保存
– 页面保存:单击文件 |另存为
– 图象保存:右健点击图象 |Save image as
?打印
– 文件 | Page Setup打印纸张设置;
– 文件 | 打印页面。
?邮寄
– 文件 |发送 |电子邮件页面 。
8、保存、打印、邮寄页面
Zhang Dongyan TCP/IP Protocols 61
?文件菜单,包括文件存取和打印功能。
?编辑菜单,包括对文本的编辑和查找。
?查看菜单,包括重传当前页面和查看当
前页面源文件。
?工具菜单,包括各种设置和工具
?收藏菜单,包括添加、整理收藏夹
?帮助菜单,包括 Netscape公司通过网络
提供的各项帮助服 务。
9、菜单栏
Zhang Dongyan TCP/IP Protocols 62
?网页及其开发
?HTML语言简介
?HTML语言的结构
6.3 网页与 HTML语言简介
Zhang Dongyan TCP/IP Protocols 63
?HTML语言是超文本标记语言( Hyperlink
Text Markup Language)的缩写。它是一种
描述文档结构的语言,HTML语言使用描述
性的标记符(称为标签)来规定显示的信息
的格式或结构。
?用 HTML语言写的页面是普通的文本文档
( ASCII),不含任何与平台和程序相关的
信息,它们可以被任何文本编辑器读取。
1、什么是 HTML
Zhang Dongyan TCP/IP Protocols 64
?HTML特点
– 文件短小,易于传输和显示
– 独立于平台,多平台兼容
– 标记大多采用, 双边,,成对出现(前面的为头
标, Opening Tag”或开始标记,后面的为尾标
,Closing Tag”或结束标记,如 <title>This is a
title</title>
?局限性
– 标识的限制
– 格式编排不方便
?书写工具,HTML编辑器或其它文本编辑器
2,HTML 语言的特点
Zhang Dongyan TCP/IP Protocols 65
?是一种超文本标记语言;
?HTML文件是一个纯 ASCII(或纯文本)文件。
?HTML文件所描述的各种效果(如字体、字号、
颜色、格式、插图、声音、动画等信息),虽然
可以用字处理软件编辑,但必须在一特定的浏览
器软件下才能观看到。
2,HTML 语言的特点(续)
Zhang Dongyan TCP/IP Protocols 66
– Web站点,WWW(万维网) 是由许多 Web站点(网
站)组成,每个 Web站点其实就是一组精心设计的
Web页面,这些页面都围绕同一个主题,有机的连接
在一起,形成一个整体。
– Web页或网页,若将 WWW看成 Internet上的大型图
书馆,则每个 Web站点就是一本书,每个 Web页面就
是其中的一张书页,是网络文件的组成部分
– 主页或首页( Homepage),按上面的说法,主页就
是该书( Web站点)的封面和目录或是整个网站文件
的起始页。可从主页进入整个网站文件,开始对网站
进行浏览。主页又代表整个网站文件的地址。
– 网络文件,存放在网络服务器上的完整信息的集合体,
包含一个或多个网页。
3、几个常用术语和约定
Zhang Dongyan TCP/IP Protocols 67
?组成内容:
– * 文件的实际文字内容(如字母、数字、空格和标点
符号等)
– * 对该文件的格式和特性进行描述的 HTML说明(标
记)
?常用的标记有:
– * <HTML>… 文件全部内容 … </HTML> ;表示
HTML文件开始与结束,无属性。
– * <HEAD>… </HEAD> ; Web页面头部标记,其中
内容一般是整个文件的序言,除显示 <TITLE>中的内
容外,其它内容均不显示。无属性。
4,HTML语言的基本框架
Zhang Dongyan TCP/IP Protocols 68
?HTML文档由标签和文字组成 ;
?标签是一个用尖括号 < > 括起来的命令词,标
签往往成对出现 ;不同标签之间可以嵌套,但
不能交叉;
?文件一般以,htm或,html为扩展名;
?HTML标签规定 Web文档的逻辑结构,并且控
制文档的显示格式,大部分 HTML标签的形式:
〈 标签名 〉 相应内容 〈 /标签名 〉
?标签对大小写不敏感。
5,HTML的标签
Zhang Dongyan TCP/IP Protocols 69
?HTML文档结构分为:
- 文件头 <head>… </head>
- 文件体 <body>… </body>;
?文件头包括文档标题 <title>… <title>;
?文件头和文件体都嵌入在
<html>… </html>标签中。
6,HTML的基本格式
Zhang Dongyan TCP/IP Protocols 70
<html>
<head>
<title>.,,</title>
<meta>
</head>
<body>
.,,
</body>
</html>
文档标题
文档的主要内容
7,HTML的基本结构
Zhang Dongyan TCP/IP Protocols 71
?<TITLE>… Web页面名称 … </TITLE> ; 用来给 Web页
面命名。浏览时,这一名称显示在浏览器的标题栏内。
每一 Web页只能有一个。
?<BODY>… Web文件体的内容 … </BODY> ; 一定要包
含在 <HTML>… </HTML>标记之内。其中可以包含属
性,如,BACKGROUND=“背景图文件名, ;
BGCOLOR=“XXXX(背景颜色码,X为十六进制
数), ; TEXT=“XXXX(文本颜色码), ;
LINK=“XXXX(链接颜色码); VLINK=“XXXX(已
访问过的超链接颜色码)
? <Hx>… </Hx> ; 定义文件中各子标题的等级,以区分
不同章节,x=1~6,即共有 6级标题。
8,HTML语言的基本框架
Zhang Dongyan TCP/IP Protocols 72
?<A>… </A> ; 定义超链接,其中可包含属性,
属性可以为,HREF=“被链接的对象,,被链接
对象可以是另一 Web页、另一 Web站点的主页、
或自己的电子邮件地址、或进一步将图作为链
接点
?<FORM>… </FORM> ; 定义表单并可将用户在
浏览器端输入的各种数据传送给 Server端的 CGI
( Common Gateway Interface)程序。其中可
包含两种属性,METHOD=“GET/POST(选择
表单的传输协议),,以及 ACTION=“表单提
交时调用的 Server端程序, 。
8,HTML语言的基本框架(续)
Zhang Dongyan TCP/IP Protocols 73
除成对出现的标签外,还有一些是单标记的标签,主要有,
?<P> ;空行标记。 加入 P标记后,先空出一行,然后再从
下一行继续显示其后的文字。属性有:
ALIGN=RIGHT/CENTER/LEFT,分别表示向右 /中 /左
看齐。
?<BR> ; 换行标记。
?<IMG> ; 设定显示的图形。其属性有,SRC=图形文件
名,ALIGN=LEFT/RIGHT/MIDDLE/TOP/BOTTOM
(图形与文字的对齐方式),WIDTH=XXX和
HEIGHT=XXX(设定图形的宽度和高度)等。
?<META> ; 用于记录 HTML文件的相关信息,这些信息
不会显示在浏览器上。必须放在 <HEAD>,</HEAD> 之
间。
8,HTML语言的基本框架(续)
Zhang Dongyan TCP/IP Protocols 74
?基本概念理解
– HTML文件存放在 Web服务器的某个目录里
– 通过 WWW浏览器下载 HTML文件,并对文件中的
标记进行解释(即浏览)
?基本成分:标题、段落、列表、表格、图象
?简单网页形式,
标题
内容段落(列表、表格、图象等)
内容段落(列表、表格、图象等)
9,简单 HTML文件介绍 --概述
Zhang Dongyan TCP/IP Protocols 75
?基本构成
– 文件的内容部分
– HTML的标志部分
?标志书写格式:
– <标识名 >文件内容 </标识名 >
– 标识名通常写在 < >内
– 不区分大小写
– 也有单向标识,<标识名 >
10,简单 HTML文件介绍 --构成
Zhang Dongyan TCP/IP Protocols 76
?四个基本标识
– <html></html>标识
– <head></head>标识
– <title></title>标识
– <body></body>标识
11、建立 简单的 HTML文件
Zhang Dongyan TCP/IP Protocols 77
?HTML文件起始标识
?成对出现
?包含文件的全部内容
<html>
文件的全部内容
</html>
12,<html></html>标识
Zhang Dongyan TCP/IP Protocols 78
– 网页头部的标识
– 写在 <head></head>之间的内容,如果又写
在,title”标识中,表示该网页的名称,并
作为浏览器标题栏的名称,显示在此网页窗
口的最上方。如果不写在,title”标识中,
则成为正文的头部,显示在文本之前。
–, head”标识中的文本应当尽量简练。
13,<head></head>标识
Zhang Dongyan TCP/IP Protocols 79
?网页名称标识
?在浏览器中作为标题栏名称显示在该窗口
的上方。
?一个网页应只有一个网页名称
?,title”标识应包含在,head”标识之间
?,title”标识内应不含任何其他标识
?,title”标识宜短小
14,<title></title>标识
Zhang Dongyan TCP/IP Protocols 80
?,body”标识中放置网页的主体内容
?成对出现
?文件取名规则:
-以 htm或 html为后缀
-文件名中不可有空格和特殊字符
-在 UNIX系统中,注意大小写敏感
-取名保存后,可在浏览器中打开
15,<body></body>标识
Zhang Dongyan TCP/IP Protocols 81
?语言字符集信息标记
<meta http-equiv=“content-type”
content=“text/html;charset=gb2312”>
16、语言字符集信息
Zhang Dongyan TCP/IP Protocols 82
?子标题是用来区分内容的不同章节的,
浏览时会显示不同的大小字型
?HTML定义了六个级别的子标题
?书写格式为,<Hn>吉安电大简介
</Hn>
?n从 1到 6,字体越来越小
17、文件的子标题
Zhang Dongyan TCP/IP Protocols 83
?<pre></pre>---原样显示文本
?<p></p>---段落标识
?<br></br>--- 行中断标识
18、几个常用的 HTML标识
Zhang Dongyan TCP/IP Protocols 84
?<html></html>
?<head></head>
?<title></title>
?<body></body>
?<Hn></Hn>
?<pre></pre>---原样显示文本
?<p></p>---段落标识
?<br></br>--- 行中断标识
19、常用标记小结
Zhang Dongyan TCP/IP Protocols 85
? <A HREF=“…/file1.html”> 链 接到 file1 </A>
被连接文件名及其路径
起始标识 结束标识
使用 <A>标识连接一个 HTML文件( file1.htm)
20、建立超链接
Zhang Dongyan TCP/IP Protocols 86
其中 HREF属性域指定了待链接文件名及其路径。
使用相对路径时,以链接所在文件为基准,可以
包含上层目录名(用,.);也可以使用绝对路径
或 URL地址。
21,<A 标签为如下形式:
Zhang Dongyan TCP/IP Protocols 87
当你在浏览器中用鼠标单击“主菜单”文字时,
就会跳转到名为 menu.html的文件。
回到 <A HREF="../menu.html">主菜单 </A>
22、显示一个链接并在 IE中显示
Zhang Dongyan TCP/IP Protocols 88
?创建链接
?链接到另一页面
?链接到 WEB的文件
?链接到文档的指定位置
Zhang Dongyan TCP/IP Protocols 89
23、本地超链接
?本地连接
– 所有连接文件都在本地磁盘上,不必连接网络
– 本地机上要有浏览器和编辑器
?同一目录下的本地连接
– 只需写文件名,不需写路径
?不同目录下的本地连接
– 必须写明连接文件路径名
– 路径名的写法:相对路径和绝对路径
– 相对路径:以当前文件所在路径和字目录为起
点,进行相对的文件查找。
– 绝对路径:以绝对路径名进行文件查找,绝对
路径中的盘符后用, |”,而不用,,,
Zhang Dongyan TCP/IP Protocols 90
相对路径名 含义
href=“file.html” 本地当前路径下的文件
href=“files/file.html” 本地当前路径下被称为,files”
的子目录 下的名为 file.html的文件
href=“file/morefiles/file.html” 当前目录下的 file子目录下
的,morefiles”子目录下名为
file.html的文件
href=“../file.html” 本地当前目录的上一级子目录下名
file.html的文件
href=“../../file.html” 当前目录的上两级子目录下名为
file.html的文件
相对路径名及其含义
Zhang Dongyan TCP/IP Protocols 91
绝对路径名 含义
HREF=“/u1/my/file.html” file.html放在 u1目录下的
my子目录下
HREF =“d|/files/file.html” file.html放在 D盘的 files目录
下的 html子目录下
说明,1、路径名书写要遵循 UNIX操作系统的格式,路径
名与目录名要以,/”分隔。
2、相对路径与绝对路径的选择。
绝对路径名及其含义
Zhang Dongyan TCP/IP Protocols 92
<A HREF=“http://www.gdrtvu.edu.cn”>your
home page </A>
被连接文件名及其路径
起始标识
结束标识
远程文件的连接
24、网络超链接
Zhang Dongyan TCP/IP Protocols 93
?网络信息的特点及其分类
?搜索引擎
?多元搜索引擎
?搜索引擎的比较及其发展趋势
6.4 网络信息检索工具
Zhang Dongyan TCP/IP Protocols 94
1、网络信息的特点及其分类
?1、网络信息资源的特点
?Internet上的信息几乎涵盖了人文科学和自
然科学的各个领域。主要有以下基本特点:
?无限性:内容十分广泛。
?丰富多彩:不止局限于文本,还包括图形、
视频、动画、声音、图表等。
?纷繁无序:提供信息的机构数不胜数,信
息格式没有统一规范,信息分散无序,变
化更新的速度很快。
Zhang Dongyan TCP/IP Protocols 95
?1、网络信息资源的特点(续)
?廉价性:目前网络信息大多数是免费提供的。
?新颖性,Internet上提供了获取非出版信息
的丰富机会,许多是主流出版渠道之外的边
缘文献,内容很新。
?广泛性:扩大了人际交流范围,提供了更多
直接交流的机会。
?注意,网络信息不是传统信息资源的简单翻
版,也不可能取代传统的信息资源,是传统
信息资源的有力补充。
1、网络信息的特点及其分类
Zhang Dongyan TCP/IP Protocols 96
1、网络信息的特点及其分类
?2、网络信息的分类
– 可以从不同的角度对网络信息进行大致的分类:
– 按信息的提供者分:可分为个人提供的和组织
(政府和公司)提供的信息两大类。
– 按访问者的权限来分:可分为开放信息和保密
信息两大类。网上信息绝大多数是开放的。
– 按信息涉及的领域来分:可分为以下 5类:
? ①教育类信息;②文化类信息;③科研类信
息;④娱乐消遣类信息;⑤政策类信息。
Zhang Dongyan TCP/IP Protocols 97
1、网络信息的特点及其分类
?3、网络信息的检索工具
– 网络信息检索工具是指在 Internet上提供
信息检索服务的一类计算机系统,其检
索对象是 Internet上的各种网络信息。
Web检索工具主要可分为以下几种类型:
– ( 1)目录型检索工具,是按某种主题
分类体系编制的一种可供检索的等级结
构式目录。用户通过该目录体系的引导,
找到有关的信息。如 Yahoo!
( www.yahoo.com)、搜狐
( www.sohu.com)等。
Zhang Dongyan TCP/IP Protocols 98
1、网络信息的特点及其分类
?3、网络信息的检索工具
– 搜索引擎,使用自动索引软件来发现、收
集并标记网页,建立数据库。以 Web形式
提供给用户一个检索界面,供用户输入关
键词之类的检索项,代替用户在数据库中
查找出与其匹配的记录并返回结果,且按
其相关度排序输出。
– 多元搜索引擎,将多个搜索引擎集成在一
块,并提供一个统一的搜索界面,检索时,
自动将一个检索提问发给多个搜索引擎同
时进行检索。
Zhang Dongyan TCP/IP Protocols 99
搜索引擎( Search Engine)是一种利用网络自动搜索技
术,对网络资源进行标记,并为检索者提供检索的工具。
1、搜索引擎的特点
搜索引擎一般由自动索引软件生成索引数据库,
具有收录加工信息范围广、速度快,能及时向用户
提供 Internet中的新增信息,可直接输入关键词或
词组进行检索。但由于人工干预少,准确性较差,
检索结果中有许多冗余信息。
2、搜索引擎
Zhang Dongyan TCP/IP Protocols 100
2、搜索引擎的工作原理或过程
搜索引擎的工作过程主要包括:信息采集、存储、加工、
处理和输出等部分。
( 1)信息采集与存储,搜索引擎一般采用自
动方式收集和存储信息,利用某些自动跟踪索引软
件追寻 WWW上的链接向前搜索,找到 Web页并将其调
出,并自动给该 Web页的某些词或全部词作上索引,
形成目标摘要格式文件后,填入网络可访问的数据
库。
2、搜索引擎(续)
Zhang Dongyan TCP/IP Protocols 101
2、搜索引擎的工作原理或过程(续)
( 2)加工:信息索引的建立
信息采集和存储后,要建立索引查询系统,其
作用是决定索引的时空比、布尔逻辑操作、表达式
匹配、词语匹配、相关性排序等。建立信息索引就
是创建文档信息的特征记录,使检索者能快速地检
索到所需信息。
2、搜索引擎(续)
Zhang Dongyan TCP/IP Protocols 102
2、搜索引擎的工作原理或过程(续)
( 3)输出:相关性处理并建立索引界面
一般情况下,网上检索的结果十分庞大,使检索
者无法逐一浏览。故搜索引擎还要根据文件的相关
程度进行排列,将最相关的文件放在最前面。
搜索引擎确定相关性的方法主要有,①概率方法 ;;
②位置方法;③摘要方法;④分类或聚类方法。
2、搜索引擎(续)
Zhang Dongyan TCP/IP Protocols 103
3、搜索引擎的检索功能
( 1)一般检索功能
这是搜索引擎的最基本的作用。这些功能主要包
括:布尔逻辑检索( Boolean)、词组检索
( Phrase)、截词检索( Truncation)、字段检索
( Fields)等。一般来说,每种搜索引擎并非包含
了所有这些检索功能,而且每种搜索引擎对其中某
一功能的侧重和表现也不相同。
2、搜索引擎(续)
Zhang Dongyan TCP/IP Protocols 104
3、搜索引擎的检索功能
( 2)特殊检索功能
特殊检索功能包括:
?自然语言( Natural Language)检索
?多语种检索
?区分大小写的检索
2、搜索引擎(续)
Zhang Dongyan TCP/IP Protocols 105
4、常用搜索引擎介绍
? google( www.google.com)
? Yahoo!( www.yahoo.com 以及中文站点,cn.yahoo.com)
? Altavista( www.altavista.digital.com)
? Lycos( www.lycos.com)
? Hotbot( www.hotbot.com)
? Northen Light( www.nlsearch.com)
? 天网( e.pku.edu.cn)
? 网络指南针( www.compass.net.edu.cn)
? 悠游北京( www.goyoyo.com.cn)
? 百度搜索( www.baidu.com )
2、搜索引擎(续)
Zhang Dongyan TCP/IP Protocols 106
什么是多元搜索引擎
多元搜索引擎( Metasearch Engine,
Megasearch Engine或 Unified Search Engine)又
称集成式搜索引擎,是将多个搜索引擎集成在一起,
向用户提供一个统一的检索界面。并且将一个检索
提问同时发给多个搜索引擎同时检索多个数据库,
经过聚合、去除重复部分并输出检索结果。使用多
元搜索引擎可让用户省时、省力。
3,多元搜索引擎
Zhang Dongyan TCP/IP Protocols 107
( 1)使用简单化
( 2)内容复杂化
( 3)功能专业化
( 4)索引智能化
4、搜索引擎的发展趋势