能否将两种结构混合在一起使用?混合能够利用两者的优点同时规避两者的缺点吗?
例如Napster:文件传输使用P2P结构,文件的搜索采用C/S结构——集中式,每个节点向中央服务器登记自己的内容,每个节点向中央服务器提交查询请求,查找感兴趣的内容
进程:主机上运行的程序
客户机进程:发起通信的进程,服务器进程:等待通信请求的进程
同一主机上运行的进程之间如何通信?进程间通信机制,操作系统提供
不同主机上运行的进程间如何通信?消息交换
不同主机上的进程间通信,那么每个进程必须拥有标识符,寻址主机——IP地址,为主机上每个需要通信的进程分配一个端口号,进程的标识符:IP地址+端口号
网络应用需遵循应用层协议
带宽(bandwidth):某些应用只有在带宽达到最低要求时才“有效”:网络视频,某些应用能够适应任何带宽——弹性应用:email
典型网络应用对传输服务的需求
典型网络应用所使用的传输层服务
超文本传输协议:HyperTextTransferProtocol,C/S结构:客户—Browser:请求、接收、展示Web对象,服务器—WebServer:响应客户的请求,发送对象,HTTP版本:1.0:RFC1945,1.1:RFC2068
使用TCP传输服务,服务器在80端口等待客户的请求,浏览器发起到服务器的TCP连接(创建套接字Socket),服务器接受来自浏览器的TCP连接,浏览器(HTTP客户端)与Web服务器(HTTP服务器)交换HTTP消息,关闭TCP连接,服务器不维护任何有关客户端过去所发请求的信息,即无状态
状态的协议更复杂:需维护状态(历史信息),如果客户或服务器失效,会产生状态的不一致,解决这种不一致代价高
非持久性连接的问题:每个对象需要2个RTT,操作系统需要为每个TCP连接开销资源(overhead),浏览器会怎么做?打开多个并行的TCP连接以获取网页所需对象,给服务器端造成什么影响?
持久性连接:发送响应后,服务器保持TCP连接的打开,后续的HTTP消息可以通过这个连接发送
无流水(pipelining)的持久性连接:客户端只有收到前一个响应后才发送新的请求,每个被引用的对象耗时1个RTT
带有流水机制的持久性连接:HTTP1.1的默认选项,客户端只要遇到一个引用对象就尽快发出请求,理想情况下,收到所有的引用对象只需耗时约1个RTT
HTTP协议有两类消息:请求消息(request),响应消息(response),请求消息:ASCII:人直接可读
HTTP请求消息的通用格式
上传输入的方法
POST方法:网页经常需要填写表格(form),在请求消息的消息体(entitybody)中上传客户端的输入
为什么需要Cookie?
HTTP协议无状态很多应用需要服务器掌握客户端的状态,如网上购物,如何实现?
Cookie技术:某些网站为了辨别用户身份、进行session跟踪而储存在用户本地终端上的数据(通常经过加密)。RFC6265
Cookie的组件:HTTP响应消息的cookie头部行,HTTP请求消息的cookie头部行,保存在客户端主机上的cookie文件,由浏览器管理,Web服务器端的后台数据库
Cookie的原理
Cookie能够用于:身份认证,购物车,推荐,Webe-mail,.......
功能:在不访问服务器的前提下满足客户端的HTTP请求。
为什么要发明这种技术?
Web缓存/代理服务器:用户设定浏览器通过缓存进行Web访问,浏览器向缓存/代理服务器发送所有的HTTP请求,如果所请求对象在缓存中,缓存返回对象,否则,缓存服务器向原始服务器发送HTTP请求,获取对象,然后返回给客户端并保存该对象,缓存既充当客户端,也充当服务器,一般由ISP(Internet服务提供商)架设
假定:对象的平均大小=100,000比特,机构网络中的浏览器平均每秒有15个到原始服务器的请求,从机构路由器到原始服务器的往返延迟=2秒
网络性能分析:局域网(LAN)的利用率=15%,接入互联网的链路的利用率=100%,总的延迟=互联网上的延迟+访问延迟+局域网延迟=2秒+几分钟+几微秒
解决方案1:提升互联网接入带宽=10Mbps;网络性能分析:局域网(LAN)的利用率=15%,接入互联网的链路的利用率=15%,总的延迟=互联网上的延迟+访问延迟+局域网延迟=2秒+几微秒+几微秒,但是成本太高
解决方案2:安装Web缓存,假定缓存命中率是0.4,网络性能分析:40%的请求立刻得到满足,60%的请求通过原始服务器满足,接入互联网的链路的利用率下降到60%,从而其延迟可以忽略不计,例如10微秒,总的平均延迟=互联网上的延迟+访问延迟+局域网延迟=0.6×2.01秒+0.4×n微秒<1.4秒
目标:如果缓存有最新的版本,则不需要发送请求对象
服务器:如果缓存的版本是最新的,则响应消息中不包含对象,HTTP/1.0304NotModified
Email应用的构成组件:邮件客户端(useragent),邮件服务器,SMTP协议(SimpleMailTransferProtocol)
邮件客户端:读、写Email消息,与服务器交互,收、发Email消息,Outlook,Foxmail,Thunderbird,Web客户端
SMTP协议:邮件服务器之间传递消息所使用的协议,客户端:发送消息的服务器,服务器:接收消息的服务器
SMTP交互示例
SMTP协议使用持久性连接,要求消息必须由7位ASCII码构成,SMTP服务器利用CRLF.CRLF确定消息的结束
与HTTP对比:
Email消息格式
Email消息格式:多媒体扩展
MIME:多媒体邮件扩展RFC2045,2056
邮件访问协议
邮件访问协议:从服务器获取邮件
POP协议
IMAP协议
所有消息统一保存在一个地方:服务器,允许用户利用文件夹组织消息,IMAP支持跨会话(Session)的用户状态:文件夹的名字,文件夹与消息ID之间的映射等
Internet上主机/路由器的识别问题,IP地址,域名:www.hit.edu.cn;问题:域名和IP地址之间如何映射?
域名解析系统DNS:多层命名服务器构成的分布式数据库,应用层协议:完成名字的解析,Internet核心功能,用应用层协议实现,网络边界复杂
DNS根域名服务器
本地域名解析服务器无法解析域名时,访问根域名服务器,根域名服务器:如果不知道映射,访问权威域名服务器,获得映射,向本地域名服务器返回映射
全球有13个根域名服务器b
TLD和权威域名解析服务器
顶级域名服务器(TLD,top-leveldomain):负责com,org,net,edu等顶级域名和国家顶级域名,例如cn,uk,fr等;NetworkSolutions维护com顶级域名服务器,Educause维护edu顶级域名服务器
权威(Authoritative)域名服务器:组织的域名解析服务器,提供组织内部服务器的解析服务,组织负责维护,服务提供商负责维护
本地域名解析服务器
不严格属于层级体系,每个ISP有一个本地域名服务器(默认域名解析服务器),当主机进行DNS查询时,查询被发送到本地域名服务器,作为代理(proxy),将查询转发给(层级式)域名解析服务器系统8
DNS查询示例
迭代查询:被查询服务器返回域名解析服务器的名字,“我不认识这个域名,但是你可以问题这服务器”
递归查询:将域名解析的任务交给所联系的服务器
如果本地域名服务器无缓存,当采用递归方法解析另一网络某主机域名时,用户主机、本地域名服务器发送的域名请求消息数分别为:一条、一条
域名递归解析过程中,主机向本地域名服务器发送DNS查询,被查询的域名服务器代理后续的查询,然后返回结果。所以,递归查询时,如果本地域名服务器无缓存,则主机和本地域名服务器都仅需要发送一次查询
DNS记录缓存和更新
记录的更新/通知机制:RFC2136,DynamicUpdatesintheDomainNameSystem(DNSUPDATE)