@leeon | 分享未来 - 互联网技术

Sep3

【转载】浏览器缓存，HTTP缓存详解

Author: 丽子 Click: 9753 Comments: 0 Category: 网络 Tag: 缓存,http

浏览器缓存现象

浏览器通过URL地址访问一个网页，显示网页内容的同时会在用户的电脑上面缓存网页内容。如果网页没有更新的话，浏览器再次访问这个URL地址的时候，就不会再次下载网页，而是直接使用本地缓存的网页。只有当网站明确标识资源已经更新，浏览器才会再次下载网页。

一、HTTP缓存涉及的http头

1. Expires（过期时间）HTTP头信息

Expires属性是告诉缓存器缓存在多长时间内是有效的。过了该时间，缓存器就会向源服务器发送请求，检查文档是否被修改。几乎所有的缓存服务器都支持Expires属性；

Web服务器设置Expires属性的方法有：

绝对时间间隔：基于客户最后查看副本的时间（最后访问时间）

根据服务器上文档最后被修改的时间

适用范围：

对于设置静态图片文件（例如导航栏和图片按钮）可缓存特别有用；因为这些图片修改很少，你可以给它们设置一个特别长的过期时间，这会使你的网站对用户变得相应非常快；
对于控制有规律改变的网页也很有用。例如：你每天早上6点更新新闻页，你可以设置副本的过期时间也是这个时间，这样缓存服务器就知道什么时候去取一个更新版本，而不必让用户去按浏览器的“刷新”按钮。

时间格式：

只能是HTTP格式的日期时间，其他的都会被解析成当前时间“之前”，副本会过期，记住：HTTP的日期时间必须是格林威治时间（GMT），而不是本地时间。举例：Expires: Fri, 30 Oct 1998 14:19:41

注意：

确认你的Web服务器时间设置正确。
Web服务器的时间和缓存服务器的时间必须是同步的，如果不同步，要么是应该缓存的内容提前过期了，要么是过期结果没及时更新。
如果设置的过期时间是一个固定的时间，如果返回内容的时候又没有连带更新下次过期的时间，那么之后所有访问请求都会被发送给源Web服务器，反而增加了负载和响应时间；

2. Cache-Control（缓存控制） HTTP头信息

有用的 Cache-Control响应头信息包括：

max-age=n 单位是秒：从请求时间开始到过期时间之间的秒数，是相对时间间隔，而不是绝对过期时间；

s-maxage=n 类似于max-age属性，除了他应用于共享（如：代理服务器）缓存；

public 标记认证内容也可以被缓存，经过HTTP认证才能访问的内容，输出是自动不可以缓存的；

no-cache 强制每次请求直接发送给源服务器，而不经过本地缓存版本的校验；

no-store 强制缓存在任何情况下都不要保留任何副本

must-revalidate 告诉缓存必须遵循所有你给予副本的新鲜度的，HTTP允许缓存在某些特定情况下返回过期数据；

proxy-revalidate和must-revalidate类似，除了他只对缓存代理服务器起作用

举例:
Cache-Control: max-age=3600, must-revalidate

注意：

给静态资源(HTML文件，图片文件等）的Repsone加上Expires/Cache-Control Header是很有效的一招。Expires的值只能是一个固定日期，比如“Thu 27 Nov 2008 07:00:00 GMT”，不能是一个类似“从现在开始之后10年”这样一个随机浮动的值，如果要这样的效果，可以用Cache-Control这样的Header，如果 HTTP Resposne中有这样的Header:“Cache-Control: max-age = 100”，表示这个资源在cache中的最大寿命是100秒。一般说来这种静态文件永远不应该过期，如果真的要给这个Cache加上一个期限，那我希望是 ——一万年，“Cache-Control: max-age = 315360000000”

其实就应该给Expires设一个永远不会过期的时间，比如你现在有一个文件叫logo.gif，需要用一个新的logo的时候，你不要去覆盖原来的文件，而把新的logo存成logo_v2.gif，让相关网页引用新的logo_v2.gif，这样可以让新老网页同时工作，实在犯不上为了节省存储空间覆盖原有文件。

配置：

对Apache服务器，使用mod_expires，在httpd.conf或者.htaccess中加上<FilesMatch “\\.(ico|gif|jpg|html)$”>ExpiresDefault “access plus 10 years”</FileMatch>

3.Last-Modified/If-Modified-Since

所有现代的浏览器都支持最近修改 (last-modified) 的数据检查。如果你曾经访问过某页，一天后重新访问相同的页时发现它没有变化，并奇怪第二次访问时页面加载得如此之快——这就是原因所在。你的浏览器首次访问时会在本地缓存页面内容，当你第二次访问，浏览器自动发送首次访问时从服务器获得的最近修改日期。服务器简单地返回 304: Not Modified (没有修改)，因此浏览器就会知道从本地缓存加载页面。

4. ETag/If-None-Match

ETag 是实现与最近修改数据检查同样的功能的另一种方法：没有变化时不重新下载数据。其工作方式是：服务器发送你所请求的数据的同时，发送某种数据的 hash (在 ETag 头信息中给出)。hash 的确定完全取决于服务器。当第二次请求相同的数据时，你需要在 If-None-Match: 头信息中包含 ETag hash，如果数据没有改变，服务器将返回 304 状态代码。与最近修改数据检查相同，服务器仅仅发送 304 状态代码；第二次将不为你发送相同的数据。在第二次请求时，通过包含 ETag hash，你告诉服务器：如果 hash 仍旧匹配就没有必要重新发送相同的数据，因为你还有上一次访问过的数据。

这几个http头可以作为meta标签发送到客户端，但是需要注意的是Http头中的设置优先级更高一些，例如：
<meta http-equiv=”Expires” CONTENT=” Fri, 30 Oct 1998 14:19:41″>
<meta http-equiv=”Cache-Control” CONTENT=”no-cache”>

我们来访问http://www.baidu.com的首页，通过firebug，我们来查看logo图片http://www.baidu.com/img/baidu_logo.gif的headers：

响应头信息

Date
Tue, 10 Aug 2010 09:31:36 GMT

Server
Apache

Last-Modified
Tue, 29 Jul 2008 16:00:00 GMT

Etag
"5d1-4532bbb6ca000"

Accept-Ranges
bytes

Content-Length
1489

Cache-Control
max-age=315360000

Expires
Fri, 07 Aug 2020 09:31:36 GMT

Connection
Keep-Alive

Content-Type
image/gif



请求头信息
Host
www.baidu.com

User-Agent
Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.2.3) Gecko/20100401 Firefox/3.6.3

Accept
image/png,image/*;q=0.8,*/*;q=0.5

Accept-Language
zh-cn,zh;q=0.5

Accept-Encoding
gzip,deflate

Accept-Charset
GB2312,utf-8;q=0.7,*;q=0.7

Keep-Alive
115

Connection
keep-alive

Referer
http://www.baidu.com/

Cookie
BAIDUID=60A41CF3CE102AC479459D7202BC7C0C:FG=1; USERID=de28364425ea7fdbeb32a85ecb7beb; BD_UTK_DVT=1

Pragma
no-cache

Cache-Control
no-cache

F5刷新，第二次查看headers：

响应头信息查看源代码

Date
Tue, 10 Aug 2010 09:37:02 GMT

Server
Apache

Connection
Keep-Alive

Etag
"5d1-4532bbb6ca000"

Expires
Fri, 07 Aug 2020 09:37:02 GMT

Cache-Control
max-age=315360000



 请求头信息查看源代码 Host
www.baidu.com

User-Agent
Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.2.3) Gecko/20100401 Firefox/3.6.3

Accept
image/png,image/*;q=0.8,*/*;q=0.5

Accept-Language
zh-cn,zh;q=0.5

Accept-Encoding
gzip,deflate

Accept-Charset
GB2312,utf-8;q=0.7,*;q=0.7

Keep-Alive
115

Connection
keep-alive

Referer
http://www.baidu.com/

Cookie
BAIDUID=60A41CF3CE102AC479459D7202BC7C0C:FG=1; USERID=de28364425ea7fdbeb32a85ecb7beb; BD_UTK_DVT=1

If-Modified-Since
Tue, 29 Jul 2008 16:00:00 GMT

If-None-Match
"5d1-4532bbb6ca000"

Cache-Control
max-age=0

我们可以看到这个图片的最后修改时间和Etag。于是浏览器把这两个状态信息连同网页内容在本地进行缓存，当浏览器再次访问该图片的时候，浏览器会发送如下两个状态标识告诉服务器，我本地缓存的网页最后修改时间和Etag，请问服务器的资源有没有在我上次访问之后有更新啊？于是服务器会核对一下，如果该用户上次访问之后没有更新过新闻，直接告诉浏览器：“没什么新东西，你还是看自己缓存的网页吧”，于是服务器就发送一个304 Not Modified的消息，其他什么都不用干了。

二、HTTP缓存有什么用？

1.像Google这种比较智能的网络爬虫可以有效识别资源的状态信息，如果使用这种缓存机制，可以大大减少爬虫的爬取次数。

2.很多内容更新不频繁的网页，尽管用户不会频繁的刷新，但是从一个比较长的时间段来看使用HTTP Cache，仍然可以起到很大的缓存作用。

3.对于历史帖子使用HTTP缓存。

例如，一些历史贴子，很少有人往后面翻页去看历史数据，也就无法被memcache缓存住，那有了http缓存，用户通过收藏夹保存或者其他方式过来，就不必去取数据了。另外爬虫也不会频繁爬去了。

三、如何在应用程序里面使用HTTP缓存

前两种就不说了，直接设置过期时间。重点说说ETAG吧。

1. 适用于新闻列表页，文章列表页等。拿最新一条数据做ETAG，该数据的最后更新时间做Last-Modified时间。

2. 适用于单篇文章页。拿文章最后修改时间和评论数做hash值作为ETAGE，最后更新时间做Lsdt-Modified时间。如果该文章作修改或多一条评论数的话，就认为该页有更新。

等等，具体应用可根据需求来定，发挥大家的思想。
总结
Expires/Cache-Control Header是控制浏览器是否直接从浏览器缓存取数据还是重新发请求到服务器取数据。只是Cache-Control比Expires可以控制的多一些，而且Cache-Control会重写Expires的规则。

Last-Modified/If-Modified-Since和ETag/If-None-Match是浏览器发送请求到服务器后判断文件是否已经修改过，如果没有修改过就只发送一个304回给浏览器，告诉浏览器直接从自己本地的缓存取数据；如果修改过那就整个数据重新发给浏览器。

Sep2

CPU性能监控小记

Author: leeon Click: 8867 Comments: 0 Category: 调优 Tag: cpu

监控 CPU 性能由以下几个部分组成：

检查system的运行队列,以及确定不要超出每个处理器3个可运行状态线程的限制.
确定CPU 利用率中user/system比例维持在70/30
当CPU 开销更多的时间在system mode,那就说明已经超负荷并且应该尝试重新调度优先级
当I/O 处理得到增长,CPU 范畴的应用处理将受到影响

Sep2

【转载】btree索引和hash索引的区别

Author: sphinxsearch Click: 9178 Comments: 0 Category: 算法 Tag: btree,hash

在mysql中，大多数索引（如 PRIMARY KEY,UNIQUE,INDEX和FULLTEXT）都是在BTREE中存储，但使用memory引擎可以选择BTREE索引或者HASH索引，两种不同类型的索引各自有其不同的使用范围。

=========以下节选网摘==========
Hash 索引结构的特殊性，其检索效率非常高，索引的检索可以一次定位，不像B-Tree 索引需要从根节点到枝节点，最后才能访问到页节点这样多次的IO访问，所以 Hash 索引的查询效率要远高于 B-Tree 索引。

可能很多人又有疑问了，既然 Hash 索引的效率要比 B-Tree 高很多，为什么大家不都用 Hash 索引而还要使用 B-Tree 索引呢？任何事物都是有两面性的，Hash 索引也一样，虽然 Hash 索引效率高，但是 Hash 索引本身由于其特殊性也带来了很多限制和弊端，主要有以下这些。

（1）Hash 索引仅仅能满足"=","IN"和"<=>"查询，不能使用范围查询。

由于 Hash 索引比较的是进行 Hash 运算之后的 Hash 值，所以它只能用于等值的过滤，不能用于基于范围的过滤，因为经过相应的 Hash 算法处理之后的 Hash 值的大小关系，并不能保证和Hash运算前完全一样。

（2）Hash 索引无法被用来避免数据的排序操作。

由于 Hash 索引中存放的是经过 Hash 计算之后的 Hash 值，而且Hash值的大小关系并不一定和 Hash 运算前的键值完全一样，所以数据库无法利用索引的数据来避免任何排序运算；

（3）Hash 索引不能利用部分索引键查询。

对于组合索引，Hash 索引在计算 Hash 值的时候是组合索引键合并后再一起计算 Hash 值，而不是单独计算 Hash 值，所以通过组合索引的前面一个或几个索引键进行查询的时候，Hash 索引也无法被利用。

（4）Hash 索引在任何时候都不能避免表扫描。

前面已经知道，Hash 索引是将索引键通过 Hash 运算之后，将 Hash运算结果的 Hash 值和所对应的行指针信息存放于一个 Hash 表中，由于不同索引键存在相同 Hash 值，所以即使取满足某个 Hash 键值的数据的记录条数，也无法从 Hash 索引中直接完成查询，还是要通过访问表中的实际数据进行相应的比较，并得到相应的结果。

（5）Hash 索引遇到大量Hash值相等的情况后性能并不一定就会比B-Tree索引高。

对于选择性比较低的索引键，如果创建 Hash 索引，那么将会存在大量记录指针信息存于同一个 Hash 值相关联。这样要定位某一条记录时就会非常麻烦，会浪费多次表数据的访问，而造成整体性能低下。

Aug28

JavaScript之trim方法三则

Author: leeon Click: 8286 Comments: 1 Category: javascript Tag: trim

ECMAscript 5规定了trim的原生方法，但老的浏览器是不支持的。现提供三种trim的方法来删除字符串头尾的空格。

方法一：

[code="js"]
function trim(text){
return text.replace(/^\s+|\s+$/g,"");
}
[/code]

此方法性能最差，但是编码简单。

方法二：

[code="js"]
function trim(text){
return text.replace(/^\s+/,""),replace(/\s+$/,"");
}
[/code]

较第一种方法性能稍好。

方法三：

[code="js"]
function trim(){
text = text.replace(/^\s+/,"");
for(var i=text.length-1;i>=0;i-){
if(/\S/.test(text.charAt(i))){
text = text.substring(0,i+1);
break;
}
}
}
[/code]

此方法在大规模字符串中性能最好

分享未来 ^Internet _Technology

【转载】浏览器缓存，HTTP缓存详解

CPU性能监控小记

【转载】btree索引和hash索引的区别

JavaScript之trim方法三则

分类

标签

归档

最新评论

我看过的书

链接

其他

Date	`Tue, 10 Aug 2010 09:31:36 GMT`
Server	`Apache`
Last-Modified	`Tue, 29 Jul 2008 16:00:00 GMT`
Etag	`"5d1-4532bbb6ca000"`
Accept-Ranges	`bytes`
Content-Length	`1489`
Cache-Control	`max-age=315360000`
Expires	`Fri, 07 Aug 2020 09:31:36 GMT`
Connection	`Keep-Alive`
Content-Type	`image/gif`

Host	`www.baidu.com`
User-Agent	`Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.2.3) Gecko/20100401 Firefox/3.6.3`
Accept	`image/png,image/;q=0.8,/*;q=0.5`
Accept-Language	`zh-cn,zh;q=0.5`
Accept-Encoding	`gzip,deflate`
Accept-Charset	`GB2312,utf-8;q=0.7,*;q=0.7`
Keep-Alive	`115`
Connection	`keep-alive`
Referer	`http://www.baidu.com/`
Cookie	`BAIDUID=60A41CF3CE102AC479459D7202BC7C0C:FG=1; USERID=de28364425ea7fdbeb32a85ecb7beb; BD_UTK_DVT=1`
Pragma	`no-cache`
Cache-Control	`no-cache`

Date	`Tue, 10 Aug 2010 09:37:02 GMT`
Server	`Apache`
Connection	`Keep-Alive`
Etag	`"5d1-4532bbb6ca000"`
Expires	`Fri, 07 Aug 2020 09:37:02 GMT`
Cache-Control	`max-age=315360000`

分享未来 Internet Technology

【转载】浏览器缓存，HTTP缓存详解

CPU性能监控小记

【转载】btree索引和hash索引的区别

JavaScript之trim方法三则

分类

标签

归档

最新评论

我看过的书

链接

其他

分享未来 ^Internet _Technology