网络 - Felix021 - So far so good

Nov 23

记Yii2的一个坑

felix021 @ 2016-11-23 00:33 [IT » 网络] 评论(1) , 引用(0) , 阅读(14286) | Via 本站原创

最近发现有些服务器会定期出现磁盘过载问题，这里记录一下追查过程，供参考。

11月10日，立山向我反映我们线上的某 service 出现了一小段时间的无响应，查看 error log，发现有几百条"208203204 connect() to unix:/var/run/php5-fpm.sock failed (11: Resource temporarily unavailable) while connecting to upstream"错误，期间 zabbix 报警 server disk io overloaded，这让我想起确实每隔 3 ~ 4 天 zabbix 都会上报 server disk io overloaded（但出现的时间点并不固定在早上或晚上，也不一定是钱牛牛的访问高峰期），与 service 的error log时间也吻合，由于该 server 也是我们钱牛牛的两台 web 服务之一，因此在磁盘过载期间，钱牛牛对外提供的服务也收到了一定影响（error log也能证实这一点）。

用于 zabbix 的监控报警和 error log 的信息都太少，无法判断发生原因，因此没有继续追查下去；但是13日早晨这个问题又出现，因此决定重视起来。我在 server 上安装了 iotop 这个工具，使用 crontab 每分钟执行：

引用

$ /usr/sbin/iotop -btoqqqk --iter=5

每隔 1s 记录一次当前访问磁盘的进程及访问速度等信息，记录 5 次后退出。

在17号捕捉到又一次磁盘过载，通过 iotop 的输出：

引用

19:09:05 9663 be/4 nginx 31583.10 K/s 31551.68 K/s 0.00 % 93.86 % php-fpm: pool www

可以看到除了知道是 php-fpm 进程在写磁盘之外，并没有什么卵用，但至少还是指明了方向，只要找出 php 在写什么文件，就能离发现原因更近。

因此我写了另一个 monitor.py (后附)，实时监控 iotop 的输出，筛选出磁盘 io 过大的进程，找出这些进程打开的文件(ls -lh /proc/$PID/fd)，上报到sentry:

引用

$ /usr/sbin/iotop -btoqqqk | ./monitor.py

又等了5天，今天（22号）终于抓到罪魁祸首：

server: PID(4252) IS USING TOO MUCH DISK IO
{
"iotop": "07:44:17 4252 be/4 nginx 288.76 K/s 94813.59 K/s 0.00 % 75.15 % php-fpm: pool www",
"proc": "/proc/4252/fd:
total 0
lrwx------ 1 nginx users 64 Nov 22 07:44 0 -> socket:[1286391831]
lrwx------ 1 nginx users 64 Nov 22 07:44 1 -> /dev/null
lrwx------ 1 nginx users 64 Nov 22 07:44 2 -> /dev/null
lrwx------ 1 nginx users 64 Nov 22 07:44 3 -> socket:[2138228391]
lrwx------ 1 nginx users 64 Nov 22 07:44 4 -> socket:[2138229146]
l-wx------ 1 nginx users 64 Nov 22 07:44 5 -> /data/www/xxx-service/runtime/logs/app.log
lr-x------ 1 nginx users 64 Nov 22 07:44 6 -> /data/www/xxx-service/runtime/logs/app.log
",
"time": "2016-11-21 07:44:17"
}

从这里可以看出，php-fpm是在读写 service 的log。log文件内容有点琐碎，但是跟往常比起来确实没有什么异常，但是文件本身有点异常：

引用

nginx@server:logs$ ls -lah
total 5.0G
drwxrwxrwx 2 nginx users 4.0K Nov 22 10:54 .
drwxrwxrwx 3 nginx users 4.0K Jul 28 15:15 ..
-rwxrwxrwx 1 nginx users 55M Nov 22 12:04 app.log
-rw-r--r-- 1 nginx users 1001M Nov 22 07:44 app.log.1
-rw-r--r-- 1 nginx users 1001M Nov 22 07:43 app.log.2
-rw-r--r-- 1 nginx users 1001M Nov 22 07:42 app.log.3
-rw-r--r-- 1 nginx users 1001M Nov 22 07:41 app.log.4
-rw-r--r-- 1 nginx users 1001M Nov 22 07:40 app.log.5

可以看出，所有的log文件都是在磁盘负载特别高的时候修改的，可见，磁盘负载高的直接原因是 yii 框架的 logrotate 机制导致的。

以下是从 yii2/framework2/vendor/yiisoft/yii2/log/FileTarget.php 拷贝出来的内容：

public $rotateByCopy = true;
...
protected function rotateFiles()
{
$file = $this->logFile;
for ($i = $this->maxLogFiles; $i >= 0; --$i) {
// $i == 0 is the original log file
$rotateFile = $file . ($i === 0 ? '' : '.' . $i);
if (is_file($rotateFile)) {
// suppress errors because it's possible multiple processes enter into this section
if ($i === $this->maxLogFiles) {
@unlink($rotateFile);
} else {
if ($this->rotateByCopy) {
@copy($rotateFile, $file . '.' . ($i + 1));
if ($fp = @fopen($rotateFile, 'a')) {
@ftruncate($fp, 0);
@fclose($fp);
}
} else {
@rename($rotateFile, $file . '.' . ($i + 1));
}
}
}
}
}

可以看出，罪魁祸首是 $rotateByCopy 默认值是 true ，而 yii2 之所以这么做，（根据框架的注释）是因为在 windows 下 log文件很可能正被另一个文件打开，导致 rename 失败（吐槽：难道就不能多写一行代码根据检测到的os的type设置这个值吗？？？）。这也解释了为什么每个被 rotate 的 log 文件的修改时间间隔1分钟。

既然找到了问题的原因，解决方案就很简单了，把这个属性修改为false即可，当然，更完善的方案是能够根据OS的类型自动检测这个值。根据这个思路，我向 yii2 官方提交了一个pull requests：https://github.com/yiisoft/yii2/pull/13057，希望能被 merge 进去吧。

完。

monitor.py:

#!/usr/bin/python
#coding:utf-8

import sys
import re
import time
import datetime
import socket
try:
import simplejson as json
except:
import json

import subprocess
from raven import Client

import requests

last_sent = 0

dsn = '__SENTRY_DSN__'

#00 - '19:07:03'
#01 - '9663'
#02 - 'be/4'
#03 - 'nginx'
#04 - '10423.06'
#05 - 'K/s'
#06 - '10423.06'
#07 - 'K/s'
#08 - '0.00'
#09 - '%'
#10 - '99.99'
#11 - '%'
#12 - 'php-fpm: pool www'

def should_skip(program):
if program == '[kjournald]':
return True

for prefix in ['gzip', 'rsync', 'ssh', 'logrotate', 'sap100', 'sar ', 'rpm ', 'updatedb', 'mysql', 'nginx', 'vim', 'cat']:
if program.startswith(prefix):
return True

return False

def run_command(*cmd):
try:
p = subprocess.Popen(cmd, stdout=subprocess.PIPE, stderr=subprocess.PIPE)
out, err = p.communicate()
if err:
raise Exception(err.strip())
return out
except Exception, e:
return 'run %s failed: %s' % (str(cmd), e)

while True:
try:
line = sys.stdin.readline().strip()
except KeyboardInterrupt:
print >>sys.stderr, "user abort"
sys.exit(0)

fields = re.split(' +', line.strip(), 12)
if len(fields) != 13:
continue

if should_skip(fields[12]):
continue

read_speed = float(fields[4])
write_speed = float(fields[6])
if read_speed > 1000 or write_speed > 1000:
date = time.strftime('%Y-%m-%d')
pid = fields[1]
client = Client(dsn)
message = '%s: PID(%s) IS USING TOO MUCH DISK IO' % (socket.gethostname(), pid)
args = {
'time' : date + ' ' + fields[0],
'iotop' : line.strip(),
'proc' : run_command('ls', '-lhR', '/proc/%s/fd' % pid),
}
print >>sys.stderr, message
print >>sys.stderr, json.dumps(args, indent=4)
client.capture('raven.events.Message', message=message, extra=args)

Mar 11

Hi, HTTPS

felix021 @ 2016-3-11 01:16 [IT » 网络] 评论(0) , 引用(0) , 阅读(10760) | Via 本站原创

Let's Encrypt项目进入Public Beta已经好久拉，不过因为使用dnspod作为域名的解析服务提供商，该项目官方刚开始的时候并不被支持（总是报错），所以拖了好久，今天才终于搞起来。

用起来还真是超简单:

1. 获取证书

$ git clone https://github.com/letsencrypt/letsencrypt
$ cd letsencrypt
$ ./letsencrypt-auto certonly -w /path/to/www-root felix021.com www.felix021.com

没有什么意外的话，获取到的证书就存在 /etc/letsencrypt/live/felix021.com/ 下面

2. 配置nginx

最简单的就是加上三行：

引用

listen 443 ssl;
ssl_certificate /etc/letsencrypt/live/felix021.com/cert.pem;
ssl_certificate_key /etc/letsencrypt/live/felix021.com/privkey.pem;

但是比较推荐的做法是增加一个80端口redirect到https的配置：

引用

server {
listen 80;
server_name felix021.com www.felix021.com;
return 301 https://www.felix021.com$request_uri;
}

然后执行 service nginx reload ，就生效了。

p.s. 对于我使用的bo-blog博客系统，还有一个坑，就是需要在blog设置里面将URL路径的http换成https，否则使用相对路径引用的css等静态文件资源还是会引用到http去（这是多么奇葩的一个特性啊...）

3. 定期更新

该项目提供的整数有效期只有90天，似乎短了点，但是实际上因为提供了命令行自动更新的方式，并不会造成多大困然，反而可以缩短因为证书泄漏而导致的风险期（貌似也提供了revoke功能，不过我没尝试）。因此官方宣称证书的有效期未来可能会进一步缩短。

想要renew证书，最直接的方式就是前面的certonly命令带上完整参数再跑一次。官方还提供了一个更简单的"letsencrypt renew"命令，会读取上次的配置来重新获取证书。

基于此可以写一个简单的renew脚本，放到root的crontab里，每个月跑一次就好拉。记得renew完要service nginx reload就好啦。

Oct 14

virtualbox虚拟机中nat和host only的网络“冲突”问题

felix021 @ 2014-10-14 11:26 [IT » 网络] 评论(1) , 引用(0) , 阅读(11383) | Via 本站原创

我大约从2010年起，就一直在自己的机器上使用 Windows宿主机+Ubuntu Server@VBox虚拟机这种组合，一方面不用抛弃windows上早已熟悉的众多GUI软件，另一方面又可以享受到Linux带来的便利，在上面做开发等等。

虽然仅仅用一个NAT就可以解决网络的问题，但是如果每次新增一个服务就要添加一个端口映射也很麻烦，所以我开了双网卡，另一个使用Host-Only，这样主机和虚拟机之间可以直接互访。

虽然有人说用Bridged Network也能解决这个问题，但是前述方法却有更多好处：首先因为是外网无法直接访问这台机器，所以可以使用弱密码；其次虚拟机里使用NAT通过宿主机访问外部网络，因此像我现在主机上的双网卡的目标网络也可以免配置直接访问。

不过昨天遇到了个问题（貌似以前也曾经遇到过），就是突然不能访问外网了（但是仍然能ping通192.168.56.1，即宿主机的Host-Only IP），经过测试发现如果把Host-Only的网卡去掉就没问题，所以看起来像是这两个网络冲突了。

经过放狗搜索，SuperUser上的一个问题提醒我，这个其实是路由表的问题，由于没有指定默认网关，因此不知道为什么Ubuntu（WinXP也会）就把Host-Only的gateway当成默认网关了。

解决问题很简单，先删掉错误的默认网关，再添加新的默认网关：

$ sudo route del default
$ sudo route add default gw 10.0.2.2

不过这个重启以后就会消失，需要保持的话，就在 /etc/network/interfaces 添加一行

up route add default gw 10.0.2.2

Sep 26

解决ssh server/client超时断开的问题

felix021 @ 2014-9-26 21:52 [IT » 网络] 评论(0) , 引用(0) , 阅读(5171) | Via 本站原创

二选一应该就行了：

(1) 客户端：修改/etc/ssh/ssh_config ，

增加ServerAliveInterval 15，这样客户端会在空闲时每15s给Server发送一个null包

增加ServerAliveCountMax 3 （默认值就是3），如果连续3次null包没有收到回应就会断开连接

(2) [类似地] 服务端：修改/etc/ssh/sshd_config，

增加ClientAliveInterval 15，这样服务端会在空闲时每15s给Client发送一个null包。

增加ClientAliveCountMax 3 （默认值就是3），如果连续3次null包没有收到回应就会断开连接

详情可以 man ssh_config 或者 man sshd_config 查看。

Apr 15

为SSH添加两步验证

felix021 @ 2014-4-15 21:42 [IT » 网络] 评论(2) , 引用(0) , 阅读(20211) | Via 本站原创

今天从@Zavior同学那里听说了Google的开源项目Google Authenticator，它除了为Google帐号的两步验证功能提供了对应的app（安卓/iOS/黑莓）之外，还将这个功能开放出来、配套一个PAM模块，使得将两步验证功能代入ssh变得非常简单，回想起以前在B公司实习时用的那个硬件token，那真是又贵又麻烦。

步骤非常简单：

注意：如果是远程操作，请先开启一个应急连接，万一失败了还有救……

0. 安装对应的app，详见项目主页

1. 编译安装(@ubuntu)

$ sudo apt-get install libpam0g-dev libqrencode3 libtool
$ git clone https://github.com/google/google-authenticator.git
$ cd google-authenticator/libpam
$ ./bootstrap.sh && ./configure
$ make && sudo make install

[update@2016-01-04] 不知道从哪个版本开始，在ubuntu下，make install不会把pam模块拷贝到指定地点，需要手工操作：
$ sudo cp .libs/pam_google_authenticator.so /lib/security/

2. 配置openssh

$ sudo vi /etc/pam.d/sshd
#最上方加一行 "auth required pam_google_authenticator.so"
#这个配置可以更复杂一些，加上一些参数，详见 libpam/README
#注：如果遇到仍然需要输入密码的情况，改成 "auth sufficient pam_google_authenticator.so" 试试。

$ sudo vi /etc/ssh/sshd_config
#将 ChallengeResponseAuthentication 选项的 no 改成 yes
$ sudo /etc/init.d/ssh restart

3. 生成密钥

$ google-authenticator #注：运行这个命令的是需要登录的用户，不是root用户
Do you want authentication tokens to be time-based (y/n) y （确认：基于时间的认证token）
【这里会显示生成二维码的地址、二维码、密钥明文、应急码】
Do you want me to update your "/var/www/.google_authenticator" file (y/n) y （确认：更新配置文件）
......
size of 1:30min to about 4min. Do you want to do so (y/n) n （token有效期是1.5min，选y就是4min）
......
Do you want to enable rate-limiting (y/n) y （30s内只允许尝试三次）

4. 在app里扫二维码，或者手动输入密钥，即可看到token每隔30s更新一次了

5. 尝试登录
$ ssh localhost
verification code: 【输入验证码】
password: 【输入密码】

最后，提醒一下使用SecureCRT的同学，你需要在Session Options -> Connection -> SSH2，将Authentication中只选用 "Keyboard Interactive" ，否则没法正常登录。

Aug 16

mixo：又一个翻墙socks5代理

felix021 @ 2013-8-16 17:23 [IT » 网络] 评论(0) , 引用(0) , 阅读(16555) | Via 本站原创

因为不满ssh tunnel的使用效果，所以2012年12月某天（大概是17号）心血来潮写了这个小东西，由于 [socks5协议]( http://www.openssh.com/txt/rfc1928.txt ) 本身很简单、加上gevent/greenlet使得异步开发跟同步似的，所以200行就搞定了。但是性能上问题很大——主要是加密有问题。尽管加密就是最简单的xor，但是因为python不适合处理大量的小对象，所以当时写了一个python扩展，性能上就没问题了，但是又多了一项麻烦的依赖。后来发现已经有更成熟的shadowsocks，于是就弃坑了，也一直没有发布。

今天[2013.08.16]心血来潮，用ctypes来实现同样的功能，似乎也挺合适的；不过跟shadowsocks比起来有两个地方做得不好，一是没有更“高级”的加密方式（他家用了M2Crypto，代码看起来很复杂），另一个是shadowsocks在本地先回应socks5请求，只把必要的host:port信息发送给server，减少了一个来回，而我原先的实现则是在server端实现完整的socks5(现在把step1搬到client了，因为改动很小)。

总之好歹也是个凑合能用的东西了，发布出来晾着吧，也许哪天有人就用上了呢。

项目地址： https://github.com/felix021/mixo

Jul 11

webpy: 在模板中包含另一个模板

felix021 @ 2013-7-11 12:39 [IT » 网络] 评论(0) , 引用(0) , 阅读(15859) | Via 本站原创

在模板里引入其他模板应该是很常见的一种需求，但是webpy默认的template居然没有提供这种机制，挺神奇的。

官方的解决办法是把某个模板的输出给另一个模板，看起来和用起来都超级不爽；知乎网友给出的解决方案也很不爽：用render初始化时指定的layout，但是这个跟include差很多，不灵活。

实际上，由于render渲染模板后的输出本身是一个字符串，所以如果能在模板里头直接调用render渲染其他模板就最好了：而且这是可以实现的，只是略带tricky。

由于webpy给render的默认globals是空的，所以模板里只能用基本的python语法，默认连builtin的东西都用不了（比如zip、str），但是可以通过初始化render时指定globals的方式来引入：

render = web.template.render('view/', cache=False, globals = __builtins__.__dict__)

所以我们只需要把render自己也加到这个globals里头去，就可以在模板里引用它了：

render_globals = {}
render = web.template.render('view/', cache=False, globals = render_globals)
render_globals['render'] = render

第三句看起来虽然tricky，但是由于python的对象传的是引用，所以可以达到预期的效果。

这样只要在模板里这样写就行了：

$:render.header('首页') #那个冒号别漏掉:)

Feb 4

探探gethostbyname

felix021 @ 2013-2-4 23:18 [IT » 网络] 评论(0) , 引用(0) , 阅读(7245) | Via 本站原创

开篇先说一下，在它的manpage里面，有这么一句话：

引用

The gethostbyname*() and gethostbyaddr*() functions are obsolete. Applications should use getaddrinfo(3) and getnameinfo(3) instead.

这是因为gethostbyname只能处理ipv4请求（经测试ipv6.google.com不能解析，ipv6.tsinghua.edu.cn只能解析出ipv4地址），因此推荐使用 getaddrinfo 来替代它。

忽略上述问题不管的话， gethostbyname 还是有点意思的。它的原型和用法大概可以这样：

struct hostent *gethostbyname(const char *name);

struct hostent *he = gethostbyname(argv[1]);
printf("%s\n", inet_ntoa(*(struct in_addr *)he->h_addr));

用法特别简单吧，如果不是在提到这个函数的时候附带说明“它使用了内部分配的空间，因此不是线程安全的”，估计会大受欢迎的。
//注：由于windows版用了 thread local 的变量，所以在windows下它是线程安全的（只要不是同一个线程马上再调用覆盖它的话）。

相应的，像ctime、localtime之类的posix接口一样，它的线程安全版就是带了 _r 后缀的 gethostname_r ，虽然名字只复杂了一点点，但是接口可不只是复杂了一点点啊：

int gethostbyname_r(const char *name, struct hostent *ret,
char *buf, size_t buflen, struct hostent **result, int *h_errnop);

其中的name是hostname（或者ip地址），ret应当指向一个分配好的struct hostent结构体（函数把内容填进去），buf应当指向一块分配好的空间（不小于buflen），result是一个struct hostent的二级指针（如果失败会存个NULL），h_errnop则指向某个int（失败则填对应的herr，这个奇葩函数的errno跟errno.h里面那个还不是一套）。

用起来真是相当地恶心，比如下面这个函数通过它来解析ip地址，跟前面的代码的复杂度完全不是一个量级的：

int host2addr(const char *host, struct in_addr *addr)
{
struct hostent he, *result;
int herr, ret, bufsz = 512;
char *buff = NULL;
do {
char *new_buff = (char *)realloc(buff, bufsz);
if (new_buff == NULL) {
free(buff);
return ENOMEM;
}
buff = new_buff;
ret = gethostbyname_r(host, &he, buff, bufsz, &result, &herr);
bufsz *= 2;
} while (ret == ERANGE);

if (ret == 0 && result != NULL)
*addr = *(struct in_addr *)he.h_addr;
else if (result == NULL)
ret = herr;
free(buff);
return ret;
}

代码是写出来了，但是觉得不太对头，仔细看了一下 struct hostent 的定义，里头还有多个指针（h_name、h_aliases、h_addr_list）什么的：

struct hostent {
char *h_name; /* official name of host */
char **h_aliases; /* alias list */
int h_addrtype; /* host address type */
int h_length; /* length of address */
char **h_addr_list; /* list of addresses */
}
#define h_addr h_addr_list[0] /* for backward compatibility */

如果不释放的话，不会造成内存泄漏么？

于是去看了下gethostbyname和gethostbyname_r的源码，进入 eglibc-2.15 的源码， ctags -r 然后 vim -t gethostbyname ，竟然没有这个函数。然后翻了翻，看到有个 inet 目录，里面有个 gethstbynm.c 这样一个奇葩的文件，里面除了include一些头文件之外，只有一些简单的宏定义和一个奇怪的include：

#define LOOKUP_TYPE struct hostent
#define FUNCTION_NAME gethostbyname
#define DATABASE_NAME hosts
#define ADD_PARAMS const char *name
#define ADD_VARIABLES name
#define BUFLEN 1024
#define NEED_H_ERRNO 1

#define HANDLE_DIGITS_DOTS 1

#include <nss/getXXbyYY.c>

打开一看 getXXbyYY.c 这个文件更奇葩了，根本就是用宏来实现C++中的模板功能啊。。。grep一下还发现，这个文件被18个其他文件include，也就是说，有18个函数（诸如gethostbyaddr, getnetbyaddr, 甚至getpwuid、getpwnam）都是用的这个模板。

凑合着看了一下，代码倒是不复杂（具体就不贴出来了），基本逻辑是这样的：

LOOKUP_TYPE *
FUNCTION_NAME (ADD_PARAMS)
{
获取锁
如buffer==NULL，分配初始化的空间
如定义了HANDLE_DIGITS_DOTS（如gethostbyname）则检查name是否是ip地址并处理（是的话就不用发dns请求了）
类似的while循环：调用对应的线程安全版函数，并检查是否buffer大小不够（如果是的话realloc）
释放锁
如果定义了NEED_H_ERRNO，设置对应的值
返回
}

也就是说，代码流程基本上跟前面调用 gethostbyname_r 的代码一样，只是多了一个获取/释放锁的操作。根据里面的流程可以看出，代码里面不是使用静态的空间，而是动态malloc的（所以要获取锁，否则在libc内部崩溃，那不好）。由此，所谓的不是线程安全的，其实并不是函数本身，而是返回的数据。

但是，看懂了这个代码，并没有解决上面的问题啊。。。于是到 stackoverflow 上面去提了个问，很快就得到大牛的回答了：

引用

You should print out the values of the pointers in that struct to find out the answer to your question. You'll discover that they all point to data inside the buffer you allocated.

So a single free is all you need to free up all the memory.

But this also means that you must not free that allocation until you've finished using or copying whatever data you're interested in.

也就是说，我完全忽略了塞给 gethostbyname_r 的 buf 这个参数：hostent 里面的指针指向的数据就存在 buf 里面，因此最后只要 free 掉它就够了。

由于有些域名可能绑定了好多个ip（比如google.com可能就绑了数十个），buf 的空间可能不够大，所以才需要一个realloc的机制。根据实测，buf的大小从512或者1024开始比较合适，普通的域名就不需要realloc了。

到此差不多该结束了，最后吐槽一句，这两个接口真奇葩啊。。。

分页： 2/26

1 2 3 4 5 6 7 8 9 10

[ 显示模式：摘要 | 列表 ]