目录
前言
网络是基于TCP/IP协议进行通信和连接的,每一台主机都有一个唯一的标识(固定的IP地址),用以区别在网络上成千上万个用户和计算机。网络在区分所有与之相连的网络和主机时,均采用一种唯一、通用的地址格式,即每一个与网络相连接的计算机和服务器都被指派一个独一无二的地址
为了保证网络上每台计算机的IP地址的唯一性,用户必须向特定机构申请注册,分配IP 地址
网络中的地址方案分为两套:IP地址系统和域名地址系统。这两套地址系统其实是一一对应的关系
由于ⅠP地址是数字标识,使用时难以记忆和书写,因此在IP 地址的基础上又发展出一种符号化的地址方案,来代替数字型的IP地址
DNS 解析
/etc/ hosts
linux系统中负责快速解析的文件,包含了ip与主机名的映射关系,在没有DNS服务器的情况下,使用本地/etc/hosts完成解析/映射,实现快速访问
PS:主要用于主机之间( IP和主机名)的映射/解析关系
192.168.226.128 master
192.168.226.129 node1
192.168.226.130 node2
/etc/resolv.conf
DNS客户端配置文件,主要用于设置DNSs服务器的IP和域名,还包含了主机域名的搜索顺序等等,这个文件是由域名解析器(resolver,一个根据主机名解析iP地址的库)使用的配置文件。
PS:主要用与匹配DNS服务器(服务端),
nameserver 114.114.114.114
nameserver 8.8.8.8
/etc/sysconfig/network-scripts/ifcfg-ens33
我们也可以在网卡配置文件中定义
DNS1=
DNS2=
域名服务器(分布式,每台主机维护一个部分)
- 保持和维扩域名空间的程序
- 响应解析器的请求
- 解析端(客户端)
向DNS服务器发出请求的设备
生效顺序:
1、hosts文件
2、网卡配置文件
3 、/etc/resolv.conf
域名
定义
标识一组主机并提供它们的有关信息的树形结构(主要确定了根在哪,就可以确定每个分支)www . baidu. com.从右往左,以"."根域为开始
域名空间结构
根域位于域名空间最顶层,一般用一个".”表示
基础单位,除了根域其他都只有一个上级域,有0或多个子域,同层域不可重复的子域或域名
顶级域
一般代表一种类型的组织机构或国家地区(主要有此两种类型构成),如
net(网络公司)、com(商业)、org (民间团体组织)、edu(教育)、gov(政府)、mil(军事)
、 cn ( 中国)、 jp (日本) 、 hk(中国
香港)
二级域
用来标明顶级域内的一个特定的组织,国家顶级域下面的二级域名由国家网络部门统一官埋,如.cn顶级域名下面设置的二级域名: .com.cn、.net.cn、.edu. cn ...
子域
用来标明顶级域内的一个特定的组织,国家顶级域下面的二级域名由国家网络部门统一管埋,如 .cn顶级域名下面设置的二级域名: .com.cn、.net.cn、.edu.cn...
主机
主机位于域名空间最下层,就是一台具体的计算机,如
ww、mail、都是具体的计算机名字,可用www.sina.com.cn.、 mail.sina.com.cn.来表示,这种表示方式称为 FQDM(完全合格域名),也是这台主机在域名中的全名
www .sina . com. cn .
网页访问(HTTP/HTTPS)
网页基本概念
网页
- 纯文本格式文件
- 编写语言为HTML、HTML5
- 在用户的浏览器中被"翻译"成网页形式显示出来
网站
- 由一个一个页面构成的,是多个网页的结合体主页
- 打开网站后出现的第一个网页称为网站主页(或首页)
域名
- 浏览网页时输入的网址
HTTP/HTTPS
- 用来传输网页的通信协议(是否加密),是一种通讯/交互的标准/规范
URL
- 是一种万维网寻址系统
HTML
- 用来编写网页的超文本标记语言
超链接
- 超链接是将网站中不同网页链接起来的功能
发布
- 将制作好的网页上传到服务器供用户访问的过程
web概述
web (world wide web)即全球广域网,也称为万维网一种分布式图形信息系统
建立在Internet上的一种网络服务
静态页面定义
- 静态网页是标准的HTML
- 文件扩展名是.htm、.html
静态页面特点
- 每个静态网页都有一个固定的URL,且URL以.htm、.html、.shtml等常见形式为后缀,而不含有"?"网页内容一经发布到网站服务器上,无论是否有用户访问,每个静态网页都是保存在网站服务器
- 静态网页的内容相对稳定,容易被搜索引擎检索
- 静态网页没有数据库的支持,在网站制作和维护方面工作量较大,因此当网站信息量很大时完全依靠静态网页制作方式比较困难静态网页的交互性较差,在功能方面有较大的限制
- 页面浏览速度迅速,过程无需连接数据库,开启页面速度快于动态页面
动态页面
网页URL不固定,能通过后台与用户交互在动态网贞网址中有一个标志性的符号——“?"
常用的语言有PHP、JSP、 Python、Ruby等
动态页面特点
交互性
网页会根据用户的要求和选择而动态改变和响应,将浏览器作为客户端界面,这将是今后WE发展的大势所趋
自动更新
无须手动地更新HTML文档,便会自动生成新的页面,可以大大节省工作量|因时因人而变
当不同的时间,不同的人访问同一网址时会产生不同的页面不同的人:访问的用户的权限、身份
不同的时间
HTTP协议概述
- HTTP(超文本传输协议HyperText Transfer Protocol)协议是互联网上应用最为广泛的一种网络协议,它是基于TCP协议的应用层传输协议,简单来说就是客户端和服务端进行数据传输的一种规则。
- HTTP/HTTPs是应用层上的协议,建立在传输层TCP之上,客户端通过与服务端进行TCP连接(三次握手),之后发送"http请求与接收http访问都是通过访问socket接口来调用TCP协议实现。(每次都会调用,)
HTTP是一种无状态(stateless)协议
HTTP协议本身不会对发送过的请求和相应的通信状态进行持久化处理(存储、保存)。这样做的目的是为了保持HTTP协议的简单性,从而能够快速处理大量的事务,提高效率。
然而,在许多应用场景中,我们需要保持用户登录的状态或记录用户购物车中的商品。由于HTTP是无状态协议,所以必须引入一些技术来记录管理状态
cookie和session 都为了实现的是http的短期的持久化(内存/缓存方式,查询快、效率比较高)
cookie
是缓存在用户端(client)浏览器中的(默认缓存一天),当下次客户端通过同一个浏览器访问客户端的时候,会优先读取cookie中的缓存信息,向服务端进行请求,同时服务端收到客户端请求的时候,读取到cookie文件,知道客户端之前找的是服务器A处理的任务,为了省事儿,省资源,干脆直接讲请求直接再交给服务器A处理
两者对比
cookie省服务器性能session更安全
HTTP协议的版本
缓存处理
在HTTP1.0中主要使用header里的If-Modified-Since ,Expires来做为缓存判断的标准,HTTP1.1则引入了更多的缓存控制策略例如Entitytag,If-UInmodified-Since,If-Match,If-None-Match等更多可供选择的缓存头来控制缓存策略。
带宽优化及网络连接的使用
HTTP1.0中,存在一些浪费带宽的现象,例如客户端只是需要某个对象的一部分,而服务器却将整个对象送过来了,并且不支持断点续传功能,HTTP1.1则在请求头引入了range头域,它允许只请求资源的某个部分,即返回码是206 (Partial Content),这样就方便了开发者自由的选择以便于充分利用带宽和连接
错误通知的管理
在HTTP1.1中新增了24个错误状态响应码,如409(conflict)表示请求的资源与资源的当前状态发生冲突;410(Gone)表示服务器上的某个资源被永久性的删除
Host头处理
在HTTP1.0中认为每台服务器都绑定一个唯一的IP地址,因此,请求消息中的URL并没有传递主机名(hostname)。但随着虚拟主机技术的发展,在一台物理服务器上可以存在多个虚拟主机(Multi-homed web Servers),并且它们共享一个IP地址。HTTP1.1的请求消息和响应消息都应支持Host头域,且请求消息中如果没有Host头域会报告一个错误( 400 Bad Request)
长连接
支持长连接(PersistentConnection)和请求的流水线(Pipelinind)处理,在一个TcP连接上可以传迭多个HrrP请求和响应,减少了建立和关闭连接的消耗和延迟,在HT71.1中默认开启connection: keep-alive,一定程度上弥补了HITP1.0每次请求都要创建连接的缺点
HTTP请求格式(GET / POST方式)
请求头(描述信息/标准化信息)
Accept:客户端可以接受的数据类型
Accept-Language:客户端可以接受的语言类型User-Agent:浏览器的信息
Accpect-Encoding:客户端可以接受的编码格式Host:表示请求的ip和端口号
Connection:告诉服务器请求连接如何处理
Keep-Alive:通知服务器回传数据不要马上关闭,保持一小段的连接Closed:马上关闭
POST请求方式
Accept:客户端可以接受的数据类型
Accept-Language:客户端可以接受的语言类型
Referer:表示请求发起时,浏览器地址栏中的地址User-Agent:浏览器的信息
Content-Type:发送的数据类型content-Length:发送的数据长度
服务器请求的区别
- Get请求是可以被缓存
- Get请求只能接收ASCII码的回复
- Post请求是不可以被缓存的。对于Post方式提交表单,刷新页面浏览器会弹出提示框"是否重新提交表单"
- Post可以接收二进制等各种数据形式,所以如果要上传文件一般用Post请求
HTTP状态码
状态码首位 | 己定义范围 | 分类 |
1xx | 100-101 | 信息提示 |
2xx | 200-206 | 成功 |
3xx | 300-305 | 重定向 |
4xx | 400-415 | 客户端错误 |
5xx | 500-505 | 服务器错误 |
常见的HTTP状态码
消息 | 描述 | 意义 |
200 | OK | 请求成功(其后是对GET和POST请求的应答文档) |
301 | Moved Permanently | 请求的永久页面跳转 |
403 | Forbidden | 禁止访问该页面 |
404 | Not Found | 服务器无法找到被请求的页面 |
500 | Internal server Error | 内部服务器错误 |
502 | Bad Gateway | 无效网关 |
503 | service Unavailable | 当前服务不可用 |
504 | Gateway Timeout | 网关请求超时 |
总结
网络上交互是基于TCP/IP协议的,我们经常会需要发布一些内容到网络上供用户访问,如果不了解http协议,我们就不能在网络故障时准确的定位故障原因。