登录 |  注册
首页 >  编程语言 >  Java多线程与并发编程专题笔记 >  Java线程的监控

Java线程的监控

1.线程池监控参数

线程池提供了以下几个方法可以监控线程池的使用情况:

方法含义
getActiveCount()线程池中正在执行任务的线程数量
getCompletedTaskCount()线程池已完成的任务数量,该值小于等于taskCount
getCorePoolSize()线程池的核心线程数量
getLargestPoolSize()线程池曾经创建过的最大线程数量。通过这个数据可以知道线程池是否满过,也就是达到了maximumPoolSize
getMaximumPoolSize()线程池的最大线程数量
getPoolSize()线程池当前的线程数量
getTaskCount()线程池已经执行的和未执行的任务总数

通过这些方法,可以对线程池进行监控,在 ThreadPoolExecutor 类中提供了几个空方法,如 beforeExecute 方法, afterExecute 方法和 terminated 方法,可以扩展这些方法在执行前或执行后增加一些新的操作,例如统计线程池的执行任务的时间等,可以继承自 ThreadPoolExecutor 来进行扩展。

2.线程池监控类

import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import java.util.Date;
import java.util.List;
import java.util.Objects;
import java.util.concurrent.*;
import java.util.concurrent.atomic.AtomicInteger;

/**
 * 继承ThreadPoolExecutor类,覆盖了shutdown(), shutdownNow(), beforeExecute() 和
 * afterExecute()
 * 方法来统计线程池的执行情况
 */
public class ThreadPoolMonitor extends ThreadPoolExecutor {
	private static final Logger LOGGER = LoggerFactory.getLogger(ThreadPoolMonitor.class);
	/**
	 * 
	 * 保存任务开始执行的时间,当任务结束时,用任务结束时间减去开始时间计算任务执行时间
	 */
	private ConcurrentHashMap<String, Date> startTimes;

	/**
	 * 
	 * 线程池名称,一般以业务名称命名,方便区分
	 */
	private String poolName;

	/**
	 * 
	 * 调用父类的构造方法,并初始化HashMap和线程池名称
	 * 
	 * @param corePoolSize
	 *            线程池核心线程数
	 * @param maximumPoolSize
	 *            线程池最大线程数
	 * @param keepAliveTime
	 *            线程的最大空闲时间
	 * @param unit
	 *            空闲时间的单位
	 * @param workQueue
	 *            保存被提交任务的队列
	 * @param poolName
	 *            线程池名称
	 */
	public ThreadPoolMonitor(int corePoolSize, int maximumPoolSize, long keepAliveTime, TimeUnit unit,
			BlockingQueue<Runnable> workQueue, String poolName) {
		this(corePoolSize, maximumPoolSize, keepAliveTime, unit, workQueue, Executors.defaultThreadFactory(), poolName);
	}

	/**
	 * 
	 * 调用父类的构造方法,并初始化HashMap和线程池名称
	 * 
	 * @param corePoolSize
	 *            线程池核心线程数
	 * @param maximumPoolSize
	 *            线程池最大线程数
	 * @param keepAliveTime
	 *            线程的最大空闲时间
	 * @param unit
	 *            空闲时间的单位
	 * @param workQueue
	 *            保存被提交任务的队列
	 * @param threadFactory
	 *            线程工厂
	 * @param poolName
	 *            线程池名称
	 */
	public ThreadPoolMonitor(int corePoolSize, int maximumPoolSize, long keepAliveTime, TimeUnit unit,
			BlockingQueue<Runnable> workQueue, ThreadFactory threadFactory, String poolName) {
		super(corePoolSize, maximumPoolSize, keepAliveTime, unit, workQueue, threadFactory);
		this.startTimes = new ConcurrentHashMap<>();
		this.poolName = poolName;
	}

	/**
	 * 
	 * 线程池延迟关闭时(等待线程池里的任务都执行完毕),统计线程池情况
	 */
	@Override
	public void shutdown() {
		// 统计已执行任务、正在执行任务、未执行任务数量
		LOGGER.info("{} Going to shutdown. Executed tasks: {}, Running tasks: {}, Pending tasks: {}", this.poolName,
				this.getCompletedTaskCount(), this.getActiveCount(), this.getQueue().size());
		super.shutdown();
	}

	/**
	 * 
	 * 线程池立即关闭时,统计线程池情况
	 */
	@Override
	public List<Runnable> shutdownNow() {
		// 统计已执行任务、正在执行任务、未执行任务数量
		LOGGER.info("{} Going to immediately shutdown. Executed tasks: {}, Running tasks: {}, Pending tasks: {}",
				this.poolName, this.getCompletedTaskCount(), this.getActiveCount(), this.getQueue().size());
		return super.shutdownNow();
	}

	/**
	 * 
	 * 任务执行之前,记录任务开始时间
	 */
	@Override
	protected void beforeExecute(Thread t, Runnable r) {
		startTimes.put(String.valueOf(r.hashCode()), new Date());
	}

	/**
	 * 
	 * 任务执行之后,计算任务结束时间
	 */
	@Override
	protected void afterExecute(Runnable r, Throwable t) {
		Date startDate = startTimes.remove(String.valueOf(r.hashCode()));
		Date finishDate = new Date();
		long diff = finishDate.getTime() - startDate.getTime();
		// 统计任务耗时、初始线程数、核心线程数、正在执行的任务数量、
		// 已完成任务数量、任务总数、队列里缓存的任务数量、池中存在的最大线程数、
		// 最大允许的线程数、线程空闲时间、线程池是否关闭、线程池是否终止
		LOGGER.info(
				"{}-pool-monitor: " + "Duration: {} ms, PoolSize: {}, CorePoolSize: {}, Active: {}, "
						+ "Completed: {}, Task: {}, Queue: {}, LargestPoolSize: {}, "
						+ "MaximumPoolSize: {},  KeepAliveTime: {}, isShutdown: {}, isTerminated: {}",
				this.poolName, diff, this.getPoolSize(), this.getCorePoolSize(), this.getActiveCount(),
				this.getCompletedTaskCount(), this.getTaskCount(), this.getQueue().size(), this.getLargestPoolSize(),
				this.getMaximumPoolSize(), this.getKeepAliveTime(TimeUnit.MILLISECONDS), this.isShutdown(),
				this.isTerminated());
	}

	/**
	 * 
	 * 创建固定线程池,代码源于Executors.newFixedThreadPool方法,这里增加了poolName
	 * 
	 * @param nThreads
	 *            线程数量
	 * @param poolName
	 *            线程池名称
	 * @return ExecutorService对象
	 */
	public static ExecutorService newFixedThreadPool(int nThreads, String poolName) {
		return new ThreadPoolMonitor(nThreads, nThreads, 0L, TimeUnit.MILLISECONDS, new LinkedBlockingQueue<>(),
				poolName);
	}

	/**
	 * 
	 * 创建缓存型线程池,代码源于Executors.newCachedThreadPool方法,这里增加了poolName
	 * 
	 * @param poolName
	 *            线程池名称
	 * @return ExecutorService对象
	 */
	public static ExecutorService newCachedThreadPool(String poolName) {
		return new ThreadPoolMonitor(0, Integer.MAX_VALUE, 60L, TimeUnit.SECONDS, new SynchronousQueue<>(), poolName);
	}

	/**
	 * 
	 * 
	 * 生成线程池所用的线程,只是改写了线程池默认的线程工厂,传入线程池名称,便于问题追踪
	 */
	static class EventThreadFactory implements ThreadFactory {
		private static final AtomicInteger poolNumber = new AtomicInteger(1);
		private final ThreadGroup group;
		private final AtomicInteger threadNumber = new AtomicInteger(1);
		private final String namePrefix;

		/**
		 * 
		 * 初始化线程工厂
		 * 
		 * @param poolName
		 *            线程池名称
		 */
		EventThreadFactory(String poolName) {
			SecurityManager s = System.getSecurityManager();
			group = Objects.nonNull(s) ? s.getThreadGroup() : Thread.currentThread().getThreadGroup();
			namePrefix = poolName + "-pool-" + poolNumber.getAndIncrement() + "-thread-";
		}

		@Override
		public Thread newThread(Runnable r) {
			Thread t = new Thread(group, r, namePrefix + threadNumber.getAndIncrement(), 0);
			if (t.isDaemon())
				t.setDaemon(false);
			if (t.getPriority() != Thread.NORM_PRIORITY)
				t.setPriority(Thread.NORM_PRIORITY);
			return t;
		}
	}
}

ThreadPoolMonitor 类继承了 ThreadPoolExecutor 类,重写了shutdown()shutdownNow() beforeExecute() afterExecute()方法来统计线程池的执行情况,这四个方法是 ThreadPoolExecutor 类预留给开发者进行扩展的方法,具体如下:

方法含义
shutdown()线程池延迟关闭时(等待线程池里的任务都执行完毕),统计已执行任务、正在执行任务、未执行任务数量
shutdownNow()线程池立即关闭时,统计已执行任务、正在执行任务、未执行任务数量
beforeExecute(Thread t, Runnable r)任务执行之前,记录任务开始时间,startTimes这个HashMap以任务的hashCode为key,开始时间为值
afterExecute(Runnable r, Throwable t)任务执行之后,计算任务结束时间。统计任务耗时、初始线程数、核心线程数、正在执行的任务数量、已完成任务数量、任务总数、队列里缓存的任务数量、池中存在的最大线程数、最大允许的线程数、线程空闲时间、线程池是否关闭、线程池是否终止信息

监控日志:

22:50:25.376 [cellphone-pool-1-thread-3] INFO org.cellphone.common.pool.ThreadPoolMonitor - cellphone-pool-monitor: Duration: 1009 ms, PoolSize: 3, CorePoolSize: 3, Active: 1, Completed: 17, Task: 18, Queue: 0, LargestPoolSize: 3, MaximumPoolSize: 3,  KeepAliveTime: 0, isShutdown: false, isTerminated: false

一般我们会依赖 beforeExecute afterExecute 这两个方法统计的信息,具体原因请参考需要注意部分的最后一项。有了这些信息之后,我们可以根据业务情况和统计的线程池信息合理调整线程池大小,根据任务耗时长短对自身服务和依赖的其他服务进行调优,提高服务的可用性。

3.线程池监控注意事项

  1. afterExecute 方法中需要注意,需要调用 ConcurrentHashMap remove 方法移除并返回任务的开始时间信息,而不是调用 get 方法,因为在高并发情况下,线程池里要执行的任务很多,如果只获取值不移除的话,会使 ConcurrentHashMap 越来越大,引发内存泄漏或溢出问题。该行代码如下:

Date startDate = startTimes.remove(String.valueOf(r.hashCode()));
2. 有了ThreadPoolMonitor类之后,我们可以通过 newFixedThreadPool(int nThreads, String poolName) newCachedThreadPool(String poolName) 方法创建两个日常我们使用最多的线程池,跟默认的 Executors 里的方法不同的是,这里需要传入 poolName 参数,该参数主要是用来给线程池定义一个与业务相关并有具体意义的线程池名字,方便我们排查线上问题。

3. 在生产环境中,谨慎调用 shutdown()shutdownNow() 方法,因为调用这两个方法之后,线程池会被关闭,不再接收新的任务,如果有新任务提交到一个被关闭的线程池,会抛出 java.util.concurrent.RejectedExecutionException 异常。其实在使用Spring等框架来管理类的生命周期的条件下,也没有必要调用这两个方法来关闭线程池,线程池的生命周期完全由该线程池所属的Spring管理的类决定。 

 

上一篇: 线程的状态与上下文切换的概念
下一篇: 多线程的优点和缺点
推荐文章
  • 在HTML中,如果你想让一个输入框(input元素)不可编辑,你可以通过设置其readonly属性来实现。示例如下:input type="text" value="此处内容不可编辑" readonly在上述代码中,readonly属性使得用户无法修改输入框中的内容。另外,如果你希望输入框完全不可交
  • ASP.NET教程ASP.NET又称为ASP+,基于.NETFramework的Web开发平台,是微软公司推出的新一代脚本语言。ASP.NET是一个使用HTML、CSS、JavaScript和服务器脚本创建网页和网站的开发框架。ASP.NET支持三种不一样的开发模式:WebPages(Web页面)、
  • C# 判断判断结构要求程序员指定一个或多个要评估或测试的条件,以及条件为真时要执行的语句(必需的)和条件为假时要执行的语句(可选的)。下面是大多数编程语言中典型的判断结构的通常形式:判断语句C#提供了以下类型的判断语句。点击链接查看每个语句的细节。语句描述if语句一个 if语句 由一个布尔表达式后跟
  • C#循环有的时候,可能需要多次执行同一块代码。通常情况下,语句是顺序执行的:函数中的第一个语句先执行,接着是第二个语句,依此类推。编程语言提供了允许更为复杂的执行路径的多种控制结构。循环语句允许我们多次执行一个语句或语句组,下面是大多数编程语言中循环语句的通常形式:循环类型C#提供了以下几种循环类型
  • C#数组(Array)数组是一个存储相同类型元素的固定大小的顺序集合。数组是用来存储数据的集合,一般认为数组是一个同一类型变量的集合。声明数组变量并不是声明number0、number1、...、number99一个个单独的变量,而是声明一个就像numbers这样的变量,然后使用numbers[0]
  • ASP.NET是一个由微软公司开发的用于构建Web应用程序的框架,它是.NETFramework的一部分。它提供了一种模型-视图-控制器(MVC)架构、Web表单以及最新的ASP.NETCore中的RazorPages等多种开发模式,可以用来创建动态网页和Web服务。以下是一些基础的ASP.NET编
学习大纲