SpeedyCloud汪尊：浅析Python多线程和多进程的使用

新闻动态

完善的7*24小时服务，携手共赢，共同成长

公司动态媒体报导

首页新闻动态公司动态正文

2015-09-23 13:25:41

9月19日，2015PyCon大会北京站成功举办。SpeedyCloud攻城狮汪尊为现场的Pythoneer分享了Python多线程与多进程的使用。

9月19日，2015PyCon大会北京站成功举办。SpeedyCloud攻城狮汪尊为现场的Pythoneer分享了Python多线程与多进程的使用，以下是演讲内容：

今天我演讲的题目是浅析Python多线程与多进程的使用。之前我们刚完成一监控项目，我们是做云计算的，监控对象是云主机、云硬盘、云数据库、云分发等等，如它们的内存、带宽、IOPS、QPS等各项指标，看是否存在异常。因为监控对象多，我们选择多线程来完成任务。

使用多线程，最主要的目的就是为了提高执行效率，充分利用系统资源。接下来说说Python多线程与多进程的使用。

项目最原始的版本里，我使用多线程来实现，但在团队进行Code Review时，架构师同学建议改用多进程来完成该任务，如下图：

当时我就奇怪为什么放弃多线程而使用多进程呢？毕竟创建一个进程的开销比创建线程的开销大，而且进程通信相当麻烦。

后来架构师让我研究了一下GIL，研究GIL后发现——上当了！之前学过JAVA，一直以为Python和JAVA的多线程没有区别，但事实上Python多了GIL。

什么是GIL？

GIL（Global Interpreter Lock 全局解释器锁）官方解释是计算机程序设计语言解释器用于同步线程的工具，使得任何时刻仅有一个线程在执行。简单来说，GIL是一把超级大锁，以阻止原生线程并发执行Python字节码,因为内存线程不安全。

不过GIL也顺带把Python多线程给干掉了：GIL会把多线程序列化，来阻止线程并发。

多线程测试

现在我们通过一个例子来了解GIL的功能：

定义一个无限死循环的函数。我的CPU是4核，于是创建4个线程，这4个线程启动后，理论上CPU使用率应达到400%左右，然而当我们看到执行结果时，却发现CPU使用率只达到150%左右，如下图：

为什么会出现这种情况呢？

原因在于GIL阻止了线程并发。

既然GIL会阻止线程并发，Python为什么还有多线程机制呢？python多线程是否毫无用处？ 当然不是!

计算机内的任务分为两种：

I/O密集型

CPU密集型

I/O密集型任务

在I/O密集型操作上，多线程的优势比较明显，举个例子：

从网站爬图，爬图是典型的I/O密集型，因为需要不断发请求，不断读图片和写图片。

如图第一个爬图用单线程实现，用了2分16秒，而改用多线程后只用了18秒,可见多线程处理I/O密集型操作，执行效率比单线程高得多。

为什么呢？我们可以看看I/O密集型执行流程图：

第1个线程开始执行，执行到I/O操作时，GIL将被释放，线程1等待I/O响应

线程2获得GIL,开始执行，执行到I/O操作时，也释放GIL，等待I/O响应

线程3获得GIL,开始执行，执行到I/O操作时，也释放GIL等待I/O响应

此时线程1完成I/O操作，它将重新获得GIL，接着往后执行

执行程序剩余步骤