连接池

作为一个专业的服务端开发工程师,我们必须要对连接池、线程池、内存池等有较深理解,并且有自己熟悉的库函数可以让我们轻松驾驭这些不同的 池子。既然他们都叫某某池,那么他们从基础概念上讲,原理和目的几乎是一样的,那就是 复用

以连接池做引子,我们说说服务端工程师基础必修课。

从我们应用最多的 HTTP 连接、数据库连接、消息推送、日志存储等,所有点到点之间,都需要花样繁多的各色连接。为了传输数据,我们需要完成创建连接、收发数据、拆除连接。对并发量不高的场景,我们为每个请求都完整走这三步(短连接),开发工作基本只考虑业务即可,基本上也不会有什么问题。一旦挪到高并发应用场景,那么可能我们就要郁闷了。

你将会碰到下面几个常见问题:

  • 性能普遍上不去
  • CPU 大量资源被系统消耗
  • 网络一旦抖动,会有大量 TIME_WAIT 产生,不得不定期重启服务或定期重启机器
  • 服务器工作不稳定,QPS 忽高忽低

这时候我们可以优化的第一件事情就是 把短链接改成长连接。也就是改成创建连接、收发数据、收发数据… 拆除连接,这样我们就可以减少大量创建连接、拆除连接耗费的时间。从性能上来说肯定要比短连接好很多。但这里还是有比较大的浪费。

举例:请求进入时,直接分配数据库长连接资源,假设有 80% 时间在与关系型数据库通讯,20% 时间是在与 Nosql 数据库通讯。当有 50K 个并行请求时,后端要分配 50K*2=100K 的长连接支撑请求。无疑这时候系统压力是非常大的。数据库再牛也抵不住滥用不是?

连接池 终于要出场了,它的解决思路是先把所有长连接存起来,谁需要使用,从这里取走,干完活立马放回来。那么按照这个思路,刚刚的 50K 的并发请求,最多占用后端 50K 的长连接就够了。省了一半啊有木有?

在 OpenResty 中,所有具备 set_keepalive 的类、库函数,说明他都是支持连接池的。

来点代码,给大家提提神,看看连接池使用时的一些注意点,麻雀虽小,五脏俱全。

  1. server {
  2. location /test {
  3. content_by_lua_block {
  4. local redis = require("resty.redis")
  5. local red = redis:new()
  6. local ok, err = red:connect("127.0.0.1", 6379)
  7. if not ok then
  8. ngx.say("failed to connect: ", err)
  9. return
  10. end
  11. -- red:set_keepalive(10000, 100) -- 坑①
  12. ok, err = red:set("dog", "an animal")
  13. if not ok then
  14. -- red:set_keepalive(10000, 100) -- 坑②
  15. return
  16. end
  17. -- 坑③
  18. red:set_keepalive(10000, 100)
  19. }
  20. }
  21. }
  • 坑①:只有数据传输完毕了,才能放到池子里,系统无法帮你自动做这个事情
  • 坑②:不能把状态未知的连接放回池子里,设想另一个请求如果获取到一个不能用的连接,他不得哭死啊
  • 坑③:逗你玩,这个不是坑,是正确的

尤其是掉进了第二个坑,你一定会莫名抓狂。不信的话,你就自己模拟试试,老带劲了。

理解了连接池,那么线程池、内存池,就应该都明白了,只是存放的东西不一样,思想没有任何区别。