前言
tomcat作为一个java servlet容器,用于运行web应用程序,其性能和吞吐量对于确保应用程序的快速响应和高效运行至关重要。
因此,tomcat调优是为了最大限度地提高系统的性能和可扩展性,以满足高并发和大流量的需求。
由于tomcat的运行依赖于jvm,从虚拟机的角度把tomcat的调整分为外部环境调优jvm和tomcat自身调优两部分,当然操作系统(内核参数)也需要配合调整优化。
tomcat 在目前的网络编程中是举足轻重的,由于tomcat的运行依赖于jvm,从虚拟机的角度把tomcat的调整分为外部环境调优 jvm 和 tomcat 自身调优两部分:
一、jvm
1.jvm 组成
1.1 jvm 组成部分:
- 类加载子系统: 使用java语言编写.java source code文件,通过 javac 编译成.class byte code文件。class loader 类加载器将所需所有类加载到内存,必要时将类实例化成实例
- 运行时数据区: 最消耗内存的空间,需要优化
- 执行引擎: 包括jit (justintimecompiler)即时编译器, gc垃圾回收器
- 本地方法接口: 将本地方法栈通过jni(java native interface)调用native method libraries, 比如:c,c++库等,扩展java功能,融合不同的编程语言为java所用
1.2jvm运行时,数据区的构成:
- method area (线程共享):方法区是所有线程共享的内存空间,存放已加载的类信息(构造方法,接口定义),常量(final),静态变量(static), 运行时常量池等。但实例变量存放在堆内存中. 从jdk8开始此空间由永久代改名为元空间
- heap (线程共享):堆在虚拟机启动时创建,存放创建的所有对象信息。如果对象无法申请到可用内存将抛出oom异常.堆是靠gc垃圾回收器管理的,通过-xmx -xms 指定最大堆和最小堆空间大小
- java stack (线程私有):java栈是每个线程会分配一个栈,存放java中8大基本数据类型,对象引用,实例的本地变量,方法参数和返回值等,基于filo()(first in last out),每个方法为一个栈帧 1 50 %
- program counter register (线程私有):pc寄存器就是一个指针,指向方法区中的方法字节码,每一个线程用于记录当前线程正在执行的字节码指令地址。由执行引擎读取下一条指令.因为线程需要切换,当一个线程被切换回来需要执行的时候,知道执行到哪里了
- native method stack (线程私有):本地方法栈为本地方法执行构建的内存空间,存放本地方法执行时的局部变量、操作数等。
1.3垃圾确定方法:
- 引用计数: 每一个堆内对象上都与一个私有引用计数器,记录着被引用的次数,引用计数清零,该对象所占用堆内存就可以被回收。循环引用的对象都无法将引用计数归零,就无法清除。python中即使用此种方式。 简单来说就是有个笔记本,记录有没有人在用,缺陷,ab 资源互相调用
- 根搜索(可达)算法 root searching
2.垃圾回收基本算法
2.1 标记-清除 mark-sweep:
分垃圾标记阶段和内存释放阶段。
标记阶段,找到所有可访问对象打个标记。
清理阶段,遍历整个堆,对未标记对象(即不再使用的对象)逐一进行清理。
2.2 标记压缩(压实)mark-compact:
分垃圾标记阶段和内存整理阶段。
标记阶段,找到所有可访问对象打个标记。
内存清理阶段时,整理时将对象向内存一端移动,整理后存活对象连续的集中在内存一端。
标记-压缩算法好处是整理后内存空间连续分配,有大段的连续内存可分配,没有内存碎片。
缺点是内存整理过程有消耗,效率相对低下。
2.3 复制 copying:
先将可用内存分为大小相同两块区域a和b,每次只用其中一块,比如a。
当a用完后,则将a中存活的对象复制到b。
复制到b的时候连续的使用内存,最后将a一次性清除干净。
缺点是比较浪费内存,只能使用原来一半内存,因为内存对半划分了,复制过程毕竟也是有代价。
好处是没有碎片,复制过程中保证对象使用连续空间,且一次性清除所有垃圾,所以效率很高。
过程:
2.4 多种算法总结:
没有最好的算法,在不同场景选择最合适的算法
- 效率: 复制算法>标记清除算法> 标记压缩算法
- 内存整齐度: 复制算法=标记压缩算法> 标记清除算法
- 内存利用率: 标记压缩算法=标记清除算法>复制算法
2.5 stw (stop the world):
对于大多数垃圾回收算法而言,gc 线程工作时,停止所有工作的线程,称为stop the world。gc 完成时,恢复其他工作线程运行。这也是jvm运行中最头疼的问题。
① 什么时候进入stw状态?
可达性分析算法中枚举根节点(gc roots)会导致所有java执行线程停顿,进入stw状态
② 为什么一定要stw停顿的原因?
分析工作必须在一个能确保一致性的快照中进行,一致性指整个分析期间整个执行系统看起来像被冻结在某个时间点上,如果出现分析过程中对象引用关系还在不断变化,则分析结果的准确性无法保证。被stw中断的应用程序线程会在完成gc之后恢复,频繁的中断会让用户感觉卡顿。所以我们要减少stw的发生,也就相当于要想办法降低gc垃圾回收的频率,stw状态和采用哪款gc收集器无关,所有的gc收集器都有这个状态,因为要保证一致性。 但是好的gc收集器可以减少停顿的时间。
3. 分代堆内存gc策略:
3.1 堆内存分代
上述垃圾回收算法都有优缺点,能不能对不同数据进行区分管理,不同分区对数据实施不同回收策略,分而治之。
将heap内存空间分为三个不同类别: 年轻代、老年代、持久代
解释:
heap 堆内存分为:
年轻代young:young generation
- 伊甸园区eden: 只有一个,刚刚创建的对象
- 幸存(存活)区servivor space:有2个幸存区,一个是from区,一个是to区。大小相等、地位相 同、可互换。
老年代tenured:old generation, 长时间存活的对象
默认空间大小比例:
规律: 一般情况*99%的对象都是临时对象
3.2 年轻代回收minor gc:
- 起始时,所有新建对象(特大对象直接进入老年代)都出生在eden,当eden满了,启动**gc。这个称为young gc 或者 minor gc。
- 先标记eden存活对象,然后将存活对象复制到s0(假设本次是s0,也可以是s1,它们可以调换),eden剩余所有空间都清空。gc完成。
- 继续新建对象,当eden再次满了,启动gc。
- 先同时标记eden和s0中存活对象,然后将存活对象复制到s1。将eden和s0清空,此次gc完成
- 继续新建对象,当eden满了,启动gc。
- 先标记eden和s1中存活对象,然后将存活对象复制到s0。将eden和s1清空,此次gc完成以后就重复上面的步骤。
通常场景下,大多数对象都不会存活很久,而且创建活动非常多,新生代就需要频繁垃圾回收。但是,如果一个对象一直存活,它最后就在from、to来回复制,如果from区中对象复制次数达到阈值(默认15次,cms为6次,可通过java的选项 -xx:maxtenuringthreshold=n 指定),就直接复制到老年代。
3.3 老年代回收 major gc::
进入老年代的数据较少,所以老年代区被占满的速度较慢,所以垃圾回收也不频繁。如果老年代也满了,会触发老年代gc,称为old gc或者 major gc。
由于老年代对象一般来说存活次数较长,所以较常采用标记-压缩算法。
当老年代满时,会触发 full gc,即对所有"代"的内存进行垃圾回收
minor gc比较频繁,major gc较少。但一般major gc时,由于老年代对象也可以引用新生代对象,所以先进行一次minor gc,然后在major gc会提高效率。可以认为回收老年代的时候完成了一次full gc。所以可以认为 majorgc = fullgc。
4. java 内存调整相关参数
4.1 jvm 内存常用相关参数
选项分类:
- -选项名称 此为标准选项,所有hotspot都支持
- -x选项名称 为稳定的非标准选项
- -xx:选项名称 非标准的不稳定选项,下一个版本可能会取消
参数 | 说明 | 举例 |
---|---|---|
-xms | 设置应用程序初始使用的堆内存大小(年轻代+老年代) | -xms2g |
-xmx | 设置应用程序能获得的最大堆内存早期jvm不建议超过32g,内存管理效率下降 | -xms4g |
-xx:newsize | 设置初始新生代大小 | -xx:newsize=128m |
-xx:maxnewsize | 设置最大新生代内存空间 | -xx:maxnewsize=256m |
-xmnsize | 同时设置-xx:newsize 和 -xx:maxnewsize,代 | -xmn1g |
-xx:newratio | 以比例方式设置新生代和老年代 | -xx:newratio=2new/old=1/2 |
-xx:survivorratio | 以比例方式设置eden和survivor(s0或s1) | -xx:survivorratio=6eden/survivor=6/1new/survivor=8/1 |
-xss | 设置每个线程私有的栈空间大小,依据具体线程 | -xss256k |
-xms 和 -xmx 建议两个值调一样大小
标准选项:
[root@localhost ~]#java 用法: java [-options] class [args...] (执行类) 或 java [-options] -jar jarfile [args...] (执行 jar 文件) 其中选项包括: -d32 使用 32 位数据模型 (如果可用) -d64 使用 64 位数据模型 (如果可用) -server 选择 "server" vm 默认 vm 是 server, 因为您是在服务器类计算机上运行。 -cp <目录和 zip/jar 文件的类搜索路径> -classpath <目录和 zip/jar 文件的类搜索路径> 用 : 分隔的目录, jar 档案 和 zip 档案列表, 用于搜索类文件。 -d<名称>=<值> 设置系统属性 -verbose:[class|gc|jni] 启用详细输出 -version 输出产品版本并退出 -version:<值> 警告: 此功能已过时, 将在 未来发行版中删除。 需要指定的版本才能运行 -showversion 输出产品版本并继续 -jre-restrict-search | -no-jre-restrict-search 警告: 此功能已过时, 将在 未来发行版中删除。 在版本搜索中包括/排除用户专用 jre -? -help 输出此帮助消息 -x 输出非标准选项的帮助 -ea[:<packagename>...|:<classname>] -enableassertions[:<packagename>...|:<classname>] 按指定的粒度启用断言 -da[:<packagename>...|:<classname>] -disableassertions[:<packagename>...|:<classname>] 禁用具有指定粒度的断言 -esa | -enablesystemassertions 启用系统断言 -dsa | -disablesystemassertions 禁用系统断言 -agentlib:<libname>[=<选项>] 加载本机代理库 <libname>, 例如 -agentlib:hprof 另请参阅 -agentlib:jdwp=help 和 -agentlib:hprof=help -agentpath:<pathname>[=<选项>] 按完整路径名加载本机代理库 -javaagent:<jarpath>[=<选项>] 加载 java 编程语言代理, 请参阅 java.lang.instrument -splash:<imagepath> 使用指定的图像显示启动屏幕
非标准的稳定选项:
[root@localhost ~]#java -x -xmixed 混合模式执行 (默认) -xint 仅解释模式执行 -xbootclasspath:<用 : 分隔的目录和 zip/jar 文件> 设置搜索路径以引导类和资源 -xbootclasspath/a:<用 : 分隔的目录和 zip/jar 文件> 附加在引导类路径末尾 -xbootclasspath/p:<用 : 分隔的目录和 zip/jar 文件> 置于引导类路径之前 -xdiag 显示附加诊断消息 -xnoclassgc 禁用类垃圾收集 -xincgc 启用增量垃圾收集 -xloggc:<file> 将 gc 状态记录在文件中 (带时间戳) -xbatch 禁用后台编译 -xms<size> 设置初始 java 堆大小 -xmx<size> 设置最大 java 堆大小 -xss<size> 设置 java 线程堆栈大小 -xprof 输出 cpu 配置文件数据 -xfuture 启用最严格的检查, 预期将来的默认值 -xrs 减少 java/vm 对操作系统信号的使用 (请参阅文档) -xcheck:jni 对 jni 函数执行其他检查 -xshare:off 不尝试使用共享类数据 -xshare:auto 在可能的情况下使用共享类数据 (默认) -xshare:on 要求使用共享类数据, 否则将失败。 -xshowsettings 显示所有设置并继续 -xshowsettings:all 显示所有设置并继续 -xshowsettings:vm 显示所有与 vm 相关的设置并继续 -xshowsettings:properties 显示所有属性设置并继续 -xshowsettings:locale 显示所有与区域设置相关的设置并继续 -x 选项是非标准选项, 如有更改, 恕不另行通知。
有不稳定选项的当前生效值:
[root@centos7 ~]#java -xx:+printflagsfinal
查看所有不稳定选项的默认值:
[root@centos7 ~]#java -xx:+printflagsinitial
示例:
指定内存空间:
#指定内存空间 [root@centos7 ~]#java -xms1024m -xmx1024m -xx:+printgcdetails -cp . heap #heap 是一个脚本文件
二、tomcat 配置文件参数优化
1. 常用的优化相关参数
- 【redirectport】如果某连接器支持的协议是http,当接收客户端发来的https 443 请求时,则转发至此属性定义的 8443 端口。
- 【maxthreads】tomcat使用线程来处理接收的每个请求,这个值表示tomcat可创建的最大的线程数,即支持的最大并发连接数,默认值是 200。
- 【minsparethreads】最小空闲线程数,tomcat 启动时的初始化的线程数,表示即使没有人使用也开这么多空线程等待,默认值是 10。
- 【maxsparethreads】最大备用线程数,一旦创建的线程超过这个值,tomcat就会关闭不再需要的socket线程。默认值是-1(无限制)。一般不需要指定。
- 【processorcache】进程缓冲器,可以提升并发请求。默认值是200,如果不做限制的话可以设置为-1,一般采用maxthreads的值或者-1。
- 【uriencoding】指定 tomcat 容器的 url 编码格式,网站一般采用utf-8作为默认编码。
- 【connnectiontimeout】网络连接超时,单位:毫秒,设置为 0 表示永不超时,这样设置有隐患的。通常默认 20000 毫秒就可以。
- 【enablelookups】是否反查域名,以返回远程主机的主机名,取值为:true 或 false,如果设置为 false,则直接返回 ip 地址,为了提高处理能力,应设置为 false。
- 【disableuploadtimeout】上传时是否使用超时机制。应设置为 true。
- 【connectionuploadtimeout】上传超时时间,毕竟文件上传可能需要消耗更多的时间,这个根据你自己的业务需要自己调,以使servlet有较长的时间来完成它的执行,需要与上一个参数一起配合使用才会生效。
- 【acceptcount】指定当所有可以使用的处理请求的线程数都被使用时,可传入连接请求的最大队列长度,超过这个数的请求将不予处理,默认为 100 个。
- 【maxkeepaliverequests】指定一个长连接的最大请求数。默认长连接是打开的,设置为1时,代表关闭长连接;为-1时,代表请求数无限制
- 【compression】是否对响应的数据进行gzip压缩,off:表示禁止压缩;on:表示允许压缩(文本将被压缩)、force:表示所有情况下都进行压缩,默认值为 off,压缩数据后可以有效的减少页面的大小,一般可以减小 1/3 左右,节省带宽。
- 【compressionminsize】表示压缩响应的最小值,只有当响应报文大小大于这个值的时候才会对报文进行压缩,如果开启了压缩功能,默认值就是 2048。
- 【compressablemimetype】压缩类型,指定对哪些类型的文件进行数据压缩。
- 【nocompressionuseragents="gozilla, traviata"】对于以下的浏览器,不启用压缩 #如果已经进行了动静分离处理,静态页面和图片等数据就不需做 tomcat 处理,也就不要在 tomcat 中配置压缩了。
2. 编辑全局配置
vim /usr/local/tomcat/conf/server.xml ...... <connector port="8080" protocol="http/11.1" connectiontimeout="20000" redirectport="8443" --71行--插入 minsparethreads="50" enablelookups="false" disableuploadtimeout="true" acceptcount="300" maxthreads="500" processorcache="500" uriencoding="utf-8" maxkeepaliverequests="100" compression="on" compressionminsize="2048" compressablemimetype="text/html,text/xml,text/javascript,text/css,text/plain,image/gif,image /jpg,image/png"/>
总结
以上为个人经验,希望能给大家一个参考,也希望大家多多支持代码网。
发表评论