`

让用Apache的网站速度更快

阅读更多

前言:
最近朋友的服务器访问量过大,导致页面打开迟缓,下载速度也降到了30-40KB/秒,由于经费和环境问题,集群方案没有得以应用。考虑了如上的因素,我决定通过对Apache增加模块来进行优化,下面是我的实施过程,如果你对其感兴趣,不妨一看。

正文:
Apache 2.0在性能上的改善最吸引人。在支持POSIX线程的Unix系统上,Apache可以通过不同的MPM运行在一种多进程与多线程相混合的模式下,增强部分配置的可扩充性能。相比于Apache 1.3,2.0版本做了大量的优化来提升处理能力和可伸缩性,并且大多数改进在默认状态下即可生效。但是在编译和运行时刻,2.0也有许多可以显著提高性能的选择。

MPM(Multi -Processing Modules,多道处理模块)是Apache2.0中影响性能的最核心特性。

毫不夸张地说,MPM的引入是Apache 2.0最重要的变化。大家知道,Apache是基于模块化的设计,而Apache 2.0更扩展了模块化设计到Web服务器的最基本功能。服务器装载了一种多道处理模块,负责绑定本机网络端口、接受请求,并调度子进程来处理请求。扩展模块化设计有两个重要好处:

  ◆ Apache可以更简洁、有效地支持多种操作系统;

  ◆ 服务器可以按站点的特殊需要进行自定制。

在用户级,MPM看起来和其它Apache模块非常类似。主要区别是在任意时刻只能有一种MPM被装载到服务器中。

下面以Linux RedHat AS3为平台,演示一下在Apache 2.0中如何指定MPM。

# wget
http://archive.apache.org/dist/httpd/httpd-2.0.52.tar.bz2
# tar jxvf httpd-2.0.52.tar.bz2
# cd httpd-2.0.52
# ./configure --help|grep mpm

显示如下: --with-mpm=MPM Choose the process model for Apache to use. MPM={beos|worker|prefork|mpmt_os2| perchild|leader|threadpool}

上述操作用来选择要使用的进程模型,即哪种MPM模块。Beos、mpmt_os2分别是BeOS和OS/2上缺省的MPM, perchild主要设计目的是以不同的用户和组的身份来运行不同的子进程。这在运行多个需要CGI的虚拟主机时特别有用,会比1.3版中的SuExec 机制做得更好。leader和threadpool都是基于worker的变体,还处于实验性阶段,某些情况下并不会按照预期设想的那样工作,所以 Apache官方也并不推荐使用。因此,我们主要阐述prefork和worker这两种和性能关系最大的产品级MPM。

prefork的工作原理
  如果不用“--with-mpm”显式指定某种MPM,prefork就是Unix平台上缺省的MPM。它所采用的预派生子进程方式也是 Apache 1.3中采用的模式。prefork本身并没有使用到线程,2.0版使用它是为了与1.3版保持兼容性;另一方面,prefork用单独的子进程来处理不同的请求,进程之间是彼此独立的,这也使其成为最稳定的MPM之一。
   prefork的工作原理是,控制进程在最初建立“StartServers”个子进程后,为了满足MinSpareServers设置的需要创建一个进程,等待一秒钟,继续创建两个,再等待一秒钟,继续创建四个……如此按指数级增加创建的进程数,最多达到每秒32个,直到满足 MinSpareServers设置的值为止。这就是预派生(prefork)的由来。这种模式可以不必在请求到来时再产生新的进程,从而减小了系统开销以增加性能。

worker的工作原理
   相对于prefork,worker是2.0 版中全新的支持多线程和多进程混合模型的MPM。由于使用线程来处理,所以可以处理相对海量的请求,而系统资源的开销要小于基于进程的服务器。但是, worker也使用了多进程,每个进程又生成多个线程,以获得基于进程服务器的稳定性。这种MPM的工作方式将是Apache 2.0的发展趋势。
   worker的工作原理是,由主控制进程生成“StartServers”个子进程,每个子进程中包含固定的ThreadsPerChild 线程数,各个线程独立地处理请求。同样,为了不在请求到来时再生成线程,MinSpareThreads和MaxSpareThreads设置了最少和最多的空闲线程数;而MaxClients设置了所有子进程中的线程总数。如果现有子进程中的线程总数不能满足负载,控制进程将派生新的子进程。

# 下面我以worker模式进行编译安装
# ./configure --prefix=/usr/local/apache --with-mpm=worker --enable-so(让它支持DSO功能,这样以后可以动态加载模块)
# make
# make install
# cd /usr/local/apache/conf
# vi httpd.conf
<IfModule worker.c> StartServers 2 MaxClients 150 ServerLimit 25 MinSpareThreads 25 MaxSpareThreads 75 ThreadLimit 25 ThreadsPerChild 25 MaxRequestsPerChild 0 </IfModule>

Worker模式下所能同时处理的请求总数是由子进程总数乘以ThreadsPerChild值决定的,应该大于等于MaxClients。如果负载很大,现有的子进程数不能满足时,控制进程会派生新的子进程。默认最大的子进程总数是16,加大时也需要显式声明ServerLimit(最大值是20000)

需要注意的是,如果显式声明了ServerLimit,那么它乘以ThreadsPerChild的值必须大于等于MaxClients,而且MaxClients必须是ThreadsPerChild的整数倍,否则Apache将会自动调节到一个相应值(可能是个非期望值)。下面是笔者的 worker配置段:
<IfModule worker.c> StartServers 3 MaxClients 2000 ServerLimit 25 MinSpareThreads 50 MaxSpareThreads 200 ThreadLimit 200 ThreadsPerChild 100 MaxRequestsPerChild 0 </IfModule>
# 保存退出。
# /usr/local/apache/bin/apachectl start
# 可根据实际情况来配置Apache相关的核心参数,以获得最大的性能和稳定性。

二、限制Apache并发连接数
我们知道当网站以http方式提供软件下载时,若是每个用户都开启多个线程并没有带宽的限制,将很快达到http的最大连接数或者造成网络阻塞,使得网站的许多正常服务都无法运行。下面我们添加mod_limitipconn模块,来控制http的并发连接数。

# wget
http://dominia.org/djao/limit/mod_limitipconn-0.22.tar.gz
# tar zxvf mod_limitipconn-0.22.tar.gz
# cd mod_limitipconn-0.22
# /usr/local/apache/bin/ apxs -c -i -a mod_limitipconn.c
# 编译好后会自动把mod_rewrite.so拷贝到/usr/local/apache/modules下,并修改你的httpd.conf文件。
# vi /usr/local/apache/conf/httpd.conf
# 在最后一行加入<IfModule mod_limitipconn.c><Location />  #所限制的目录所在,此处表示主机的根目录MaxConnPerIP 2  #所限制的每个IP并发连接数为2个</Location></IfModule>
# 保存退出。
# /usr/local/apache/bin/apachectl start
# 下面我们用蚂蚁或快车测试一下,如图1:

如出现上述图所示,则表明配置成功。

三、防止文件被盗链
我们刚才已经限制了IP并发数,但如果对方把链接盗链到别的页面,我们刚才做的就毫无意义了,因为他完全可以通过蚂蚁或快车进行下载。所以就这种情况,我们要引用mod_rewrite.so模块。这样,当他盗链了文件,通过mod_rewrite.so模块把页面引到了一个事先我们制定好的错误页面里,这样就防止了盗链。
# /usr/local/apache/bin/apxs -c -i -a /opt/httpd-2.0.52/modules/mappers/mod_rewrite.c
# 编译好后会自动把mod_rewrite.so拷贝到/usr/local/apache/modules下,并修改你的httpd.conf文件。
# vi /usr/local/apache/conf/httpd.conf
RewriteEngine onRewriteCond %{HTTP_REFERER} !^http://www.squall.cn/.*
$ [NC]RewriteCond %{HTTP_REFERER} !^http://www.squall.cn$ [NC]RewriteCond %{HTTP_REFERER} !^http://squall.cn/.*$ [NC]RewriteCond %{HTTP_REFERER} !^http://squall.cn$ [NC]RewriteRule .*\.(jpg|gif|png|bmp|tar|gz|rar|zip|exe)$ http://www.squall.cn/error.htm [R,NC]
# 我们打开浏览器测试一下,如图2:

分享到:
评论

相关推荐

    Apache 网站速度更快

    大家知道,Apache是基于模块化的设计,而Apache 2.0更扩展了模块化设计到Web服务器的最基本功能.服务器装载了一种多道处理模块,负责绑定本机网络端口、接受请求,并调度子进程来处理请求.扩展模块化设计有两个重要好处:...

    Windows下配置好的apache-maven-3.6.1

    1、更快的构建速度:Maven 3.6 在性能方面进行了改进,使用了更快的算法和优化,从而加快了构建的速度。 2、修复了一些 bug:Maven 3.6 版本对之前版本中的一些问题进行了修复,提高了稳定性和可靠性。 3、更新了...

    Apache+Kylin权威指南.pdf

    更重要的是公众号里面也有Apache Kylin相关文章噢,减少你的学习成本。 Kylin采用多维立方体预计算技术,可以将大数据的SQL查询速度提升到亚秒级别。相对于之前的分钟乃至小时级别的查询速度,亚秒级别速度是百倍到...

    Apache 2.4.33(32位 64位)最新版.zip

    软件介绍: 功能非常强大的WEB服务器软件Apache HTTP Server Apache-2.4.33,这是它的32位和X64位版本,能够运行在所有的计算机平台上,由于其安全性高且具备...速度快可靠性高,通过简单的API扩展增加更多功能。

    HUI3.0 更轻、更快、更漂亮的UI框

    更小、更快、灵活的dom操作 HUI 用最少的代码去实现每一个模块,核心css文(未件压缩)26k、核心js文件(未压缩)26k。同时HUI 提供灵活的选择器及dom操作方法来完成复杂的dom操作。 插件拆分更轻、更快 HUI 将较...

    ApacheAvro纯JavaScript实现avsc.zip

    速度相当于 JSON 的两倍,同时更少的编码(varies per schema).无依赖, avsc 甚至可以在浏览器运行表现:解码吞吐率的示意图(越高越好):库比较:node-avsc, this package.node-json, built-in JSON serializer....

    Apache Nutch v1.15

    Volume数据体量巨大,Variety数据类型繁多,Value价值密度低,商业价值高,Velocity处理速度快。 Hadoop是大数据的核心技术之一,而Nutch集Hadoop之大成,是Hadoop的源头。学习Hadoop,没有数据怎么办?用Nutch抓!...

    Seeker---A-Search-Engine:使用 Nutch 和 Hadoop 实现搜索引擎

    爬取的数据和倒排索引保存在nosql MongoDB数据库中,响应速度更快,扩展性更强。 Web 应用程序使用部署在 Apache Tomcat 服务器中的 REST Web 服务与数据库进行通信。 网页通过算法 TF-IDF 和链接分析进行排名。

    使用ApacheSpark构建实时分析Dashboard

    本篇文章中我们将学习如何使用Apache Sparkstreaming,Kafka,Node.js,Socket.IO和Highcharts构建实时分析Dashboard。电子商务门户希望构建一个实时...MapReduce快近10倍,而内存中的数据分析速度则快近100倍。更多

    BeanMapper:比BeanUtils.copyProperties更快

    由于BeanUtils(Spring或Apache Commons)的copyProperties实现是利用反射实现的,它在大量调用时具有比较严重的性能问题。 BeanMapper通过javassist类库实现在运行时直接生成字节码来转换类,在首次生成后,后续...

    php+mysql建站源代码

    和php配合最好的Mysql也是免费,相对的SQL Sever就要收费了,外国人喜欢网站干净,简约,google那样的,我曾经在网站上挂的好多flash都被顾客要求删除了,相对与简单的网站来说,PHP响应速度更快,网站建成速度也最...

    incubator-crail:Apache crail的镜像(正在孵化)

    共享应用程序和文件系统客户端的单个内核可以以高达100Gbps或更高的速度驱动顺序的读/写操作利用基于RDMA的网络硬件的异步特性的异步API 可扩展的插件体系结构:可以轻松添加针对特定硬件量身定制的新存储层Crail在J

    mod_pLua:使用Lua开发Web应用程序的Apache模块-开源

    mod_pLua是Apache httpd Web服务器的模块,它可以使用类似PHP的语法以及CGI风格的接口来使用预处理的(嵌入html的)Lua脚本,但速度要快得多。 有关更详细的描述,请参见Wiki:...

    Apache Nutch网络爬虫-其他

    Volume数据体量巨大,Variety数据类型繁多,Value价值密度低,商业价值高,Velocity处理速度快。&lt;/p&gt;&lt;p&gt;Hadoop是大数据的核心技术之一,而Nutch集Hadoop之大成,是Hadoop的源头。学习Hadoop,没有数据怎么办?用...

    UPUPW APACHE PHP5.2.17经典珍藏版

    UPUPW Apache PHP5.2.17系列 一直有着省内存、速度快、运行稳定、服务器架设率高等良好口碑,本次更新全面重构所有内核更突显便捷与稳健,命名为经典珍藏版。 PHP5.2.17经典珍藏版修改和

    爱淘客1.30免费版

    让访问速度更快,效率更高。 [系统环境需求] 1、Windows 平台: IIS/Apache + PHP5 2、Linux/Unix 平台 Apache + PHP5 建议使用平台:Linux + Apache2.2 + PHP5.2 3、PHP必须环境或启用的系统函数: allow_...

    Apache Nutch-其他

    Volume数据体量巨大,Variety数据类型繁多,Value价值密度低,商业价值高,Velocity处理速度快。&lt;/p&gt;&lt;p&gt;Hadoop是大数据的核心技术之一,而Nutch集Hadoop之大成,是Hadoop的源头。学习Hadoop,没有数据怎么办?用...

Global site tag (gtag.js) - Google Analytics