Mar 3

Yet Another False-Sharing Test 不指定

felix021 @ 2013-3-3 23:31 [IT » 硬件] 评论(0) , 引用(0) , 阅读(12265) | Via 本站原创
前天在 coolshell 里看到 并发框架Disruptor译文 以后 ,才感慨了CPU娘的傲娇,没一会儿就看到 Dutor 同学的 A False-Sharing Test ,发现差距好大(4线程4倍- ,16线程8倍+ ,我用dutor的代码实测16线程性能差距接近20倍),于是也写了段小代码来测试它。跟dutor同学不一样,我用的是 c 实现的,看起来可能没那么易读。

#include <stdio.h>
#include <stdlib.h>
#include <pthread.h>
#include <sys/time.h>
#include <limits.h>

void *tester(void *arg)
{
    long *nloop = (long *)arg; //这里之前笔误写成int了。
    while ( (*nloop)-- );
    return NULL;
}

int driver(int nthread, int nloop, int npad)
{
    size_t size = npad + sizeof(long); //每个线程占用sizeof(long) + npad的空间
    char buff[size * nthread];
    pthread_t th[nthread];

    struct timeval s, e;
    gettimeofday(&s, NULL);

    for (int i = 0; i < nthread; i++) {
        int *arg = (int *)(buff + size * i);
        *arg = nloop;
        pthread_create(&th[i], NULL, tester, (void *)arg);
    }

    void *pret;
    for (int i = 0; i < nthread; i++)
        pthread_join(th[i], &pret);

    gettimeofday(&e, NULL);

    return (e.tv_sec - s.tv_sec) * 1000000 + e.tv_usec - s.tv_usec;
}

int main()
{
    int nloop = 1024 * 1024 * 128, nthread = 16, npad, best_padding = 0, best_usage = INT_MAX;
    printf("nloop = %d, nthread = %d\n\n", nloop, nthread);
    for (npad = 64; npad >= 0; npad -= 8) { //之所以步长为8是为了避免非8字节对齐long可能有的性能损失
        int i, usage = 0;;
        for (i = 0; i < 3; i++)
            usage += driver(nthread, nloop, npad);
        usage /= 3;
        if (usage < best_usage) {
            best_usage = usage;
            best_padding = npad;
        }
        printf("padding: %2d, time usage: %12d\n", npad, usage);
    }
    printf("\nbest padding: %2d, time usage: %12d\n", best_padding, best_usage);
    return 0;
}

引用
$ gcc false_sharing.c -lpthread -std=c99
$ ./a.out
nloop = 134217728, nthread = 16

padding: 64, time usage:      491395
padding: 56, time usage:      477760
padding: 48, time usage:      853594
padding: 40, time usage:      834318
padding: 32, time usage:      905200
padding: 24, time usage:      940989
padding: 16, time usage:      991595
padding:  8, time usage:      1040412
padding:  0, time usage:      1112716

best padding: 56, time usage:      477760

该机器使用的是4颗4核8线程的Xeon E7520@1.87GHz (16个物理核心32个逻辑核心),64GB RAM,/proc/cpuinfo里的cache_alignment是64

可以看出来,padding=56(也就是正好对齐到一个cache行)的时候效率最高,是没有填充时的2倍+的效率,虽然明显,但是显著地没有dutor的测试那么夸张。

把dutor的代码稍微改了下,s[ith].n = NLOOP,且pthread_create的时候传入的参数改成 (void *)&(s[ith].n),然后hook程序改成
size_t *n = (size_t *)args;
while ( (*n)-- );
return NULL;

其运行效率提升显著,padding=56的时候能快10%左右,而padding=0的时候能快达7倍之巨,最终的性能差距大约可以降至 3 倍的差距。这说明dutor的测试方法并不是测试裸的性能差距,带来的了一定的误差。

由于现在多数CPU都已经有了共享的L2或者L3 Cache,Cache Line失效的问题得到了相当的改善,不过不同物理CPU上仍然需要注意这个问题。

然而有一点我不能理解,这个修改对两种情况的影响竟相差这么大,这里头又有什么玄机呢...... #UPDATE: 后根据dutor的测试,我去掉了 for 循环中用到的循环变量 i 之后,性能差距立即将至2倍左右,修改循环的方向或者将for改成while则无效,因此这很可能是分支预测失效带来的问题了。
Nov 22
贱板 GA-880GM-USB3 rev3.1 很不幸买的时候没有注意,只有SATA II。怀揣Hitachi 7k1000,垂涎M4性能良久,无奈囊中羞涩。

最近看到×讯的Corsair Vengeance 4G*2特价299,于是入了一对,恰逢×迅搞活动,拿到了1000-100的优惠券,M4 64G=725-100,价格就还不错,于是于是一狠心,跟别人凑单买了这个M4 64G。

因为是在公司收到货的,所以提前带了个USB2.0的移动硬盘盒,装上测试了一下,惨不忍睹,读取30写入20,连我的S102 16GB都不如(35/25),但是读写延时还是很给力了,分别是0.1/0.2ms。大概扫了一下确认全盘读取没有问题,于是等回家再测。

亏得先前买了个2.5=>3.5的架子(把移动硬盘卸下来装上去了),于是到家以后马上把M4架上去折磨。AS SSD Benchmark一测,不对,分数才165,坑爹啊!后发现原来不知道啥时候把BIOS里的SATA改成了Native IDE(但分区是4K对齐的)。于是sysprep了一把(否则重启会蓝屏),然后把BIOS改回AHCI,正常了,418分,0002固件,中规中矩,貌似大家64G@SATA2都是这个分数吧。

点击在新窗口中浏览此图片
Nov 16
[UPDATE 11.20] 昨天发现通用PE工具箱出了2.0版本,更新一下,体积增加了一点,并且把GHOST换成了11.5版,这样SSD对齐就不愁了。有需要的同学自己选择吧,下载地址: http://dl.dbank.com/c09zz78k5g

[UPDATE 11.19] 发现无忧论坛有人做了个神器 fbinst和对应的GUI fbinstool,可以把ISO写进去,类似量产的CDROM。

  可能很多人不知道U盘其实可以有多个分区的。在U盘的主控与PC通讯的时候,有一个Bit,叫做Removable Media Bit(简称RMB哟),让操作系统知道,这个设备是不是“可移动设备”。对于U盘,这个Bit一般是被设置成1,而移动硬盘则设置成0。所以U盘的分区在我的电脑中被分类到“可移动磁盘”,移动硬盘的分区却是在“硬盘”列表里。Windows有一个强制的规定,如果一个存储设备是可移动磁盘,那么这个设备只能分一个区;即使有多个分区,也只能给第一个分区分配盘符。很霸道吧。据说是因为早期版本的Windows创建对齐的的分区不是xx对齐的,使得闪存的读取效率低,才加了这个规定。反正我觉得不太合理。

  题外话1,Linux没有这个限制,可以任意挂载U盘上的分区,所以安卓论坛上会建议某些人把tf卡分出一个区,格式化成ext2,挂载到/data,美名曰app2ext,这样就不需要app2sd,安装到卡上的程序更稳定。

  题外话2,很多U盘(但不是所有U盘)的量产工具支持将这个RMB设置为0,这样U盘会被操作系统认为是移动硬盘,就可以分区了;甚至还可以加载一个ISO文件把它当作一个USB光驱来启动系统,详情可搜索 ChipGenius 或者 UpanTool 。

  言归正传,手头的U903和S102是IS902主控的,量产工具不太靠谱(第一次买的U903就被我量产挂了,让X东返修,结果它直接给我退货了),只好老老实实当作可移动磁盘用。尽管只能有一个盘符,也还是有些东西可以挖的。折腾了半天,在此推出Felix021版 PE.SATA.U2,功能嘛,就是把网上流传的 《通用PE工具箱v1.9.6》塞进U盘的第二个分区。这个PE工具箱很好用,支持大部分SATA驱动,包含很多好工具,而且还支持安装Vista/ Win7 /2008到硬盘。

  好处有3: 1.跟U盘的正常数据区分开来,不会误删,甚至格式化U盘分区都无所谓;2.PE是单独的分区,而且永远不会被Windows载入,不用担心病毒感染;3.(相比于量产+ISO的U盘)不会有多余的分区;4.对不起我数学不好。

  下载地址: http://dl.dbank.com/c02b4urxuu ,使用说明在安装包里有了。

  注意:1. 并不是所有U盘都支持启动,很多读卡器不支持; 2. 不保证在所有机器上都能启动; 3. 不保证所有SATA都能支持,不支持的话请手动改BIOS设置成IDE模式; 4. 喝完水忘了T_T。

  下面是具体实现过程,记录一下,以后如果它有更新,能记得怎么再来一次。。。伸手党可以不用浪费时间了。
Nov 15
坎坷经历就不说了,反正最后是¥79买的郎科U903 8GB,128买的威刚S102 16GB,直接上图。

Windows 7 32bit Ultimate, X3 450 3.2G, DDR3 1600 4GB.

测试:ATTO Disk Benchmark, 0.5~8192KB, 256MB读写速度;HDTune存取时间/突发传输速率

详情如下:
Nov 3

折腾换脑记 不指定

felix021 @ 2011-11-3 23:03 [IT » 硬件] 评论(7) , 引用(0) , 阅读(6560) | Via 本站原创
首先声明,换的是电脑,不是大脑,跟RPT那货是不一样的。换脑的想法是这么来的。

在7月份某个阳光明媚草长莺飞的早晨,和sandy同学一起坐在开往某厂的636上面。注意,是坐,那天公交车居然很空。sandy同学用一种略带兴奋的语气说,京东上有一个Acer的本,i3 370,才只要2699(现在京东还是这价,AS4739-372G32Mikk),很适合买来写码啊。于是开始讨论,发现自己太久没有关注硬件了,连i3集成显卡都不知道,而且这卡还不算太差。B公司给Boluor同学发的那个X201i,用的就是i3的CPU,玩一般的游戏也是没有压力的。

于是开始考虑,是不是可以把我手头用了一年半的Acer本本卖掉(起码可以破除买->丢->买的恶性循环?),然后添点钱换个i3的本本。毕竟那是AMD当时新平台最低端的CPU,M320 2.1G,跑Win7还是略有压力。XP倒是很顺畅,只是用久了Win7,XP用起来实在是不习惯。接下来的一段时间,经常在某东上闲逛,发现本本都便宜到这个地步了,2k4买能有T4500 + 2G DDR3,性能不见得比我这个本子差。于是关注了下,发现3000以下的i3本也有好几个了,蛋疼得心动啊。

然后又是某个阳光明媚草长莺飞的早晨(7月底),和sandy同学一起站在开往某厂的636上面(这回是站着了)。魔都的公交车上都配有一个小显示屏,放些广告什么的,当时放的是,免费、快速、卖得掉,也就是某姓网的广告。到了某厂,跟sandy同学讨论说(sandy同学曾经把他用1w+买的BenQ S41以大约1850元的价格卖个了ZGC的JS),我这本扔上去卖个1K5怎么样,他说,很不错啊这个价格,我的本比你的好才卖了1850,还是一年前啊。于是就上百姓去看了看,我这一看啊,我勒个去,满眼小白,又老又旧的本本还开价1K5或者更高。顿时信心暴涨啊,把心理价位给定在了1K7,如果再低的话,不如过年回去扔给家里。

于是根据Sandy同学当年在zol卖本的帖子发了个帖子出去,开价2K。然后下午就有人给电话了,只是价格谈不拢。后来想了想,在Sandy同学的建议下(1999),把价格改成了1949。接下来的一段时间里面各种折腾,N个电话,最低有开1K5的,也有好几个1K7的,但不想卖,毕竟现在自己用着,被买走要折腾好久,麻烦。甚至有个开价1K8的到家里来看了本,但是觉得不送包鼠不太满意,跑了。。。。期间受到Sandy同学的各种毒害,觉得买个台式机也挺好的,好CPU、大容量、高转速硬盘、大显示器……唯一的一点"小"缺陷就是不太便携……

过了几天,在8月14号那个阳光明媚草长莺飞的周日早晨,和sandy同学一起到某厂加班。玩了一会儿,还没开始干活,扣扣上有个人加好友。谈了7句话,连价格都没还,还是我自己SB地说,1900包邮怎样,买家说,“嗯 可以”。我勒个去啊,这个买家要不要这么实诚搞得我都不好意思了……于是下午奔回家把数据备份了,然后写了个程序把硬盘全部写了过去。晚上打包好,周一早上叫了宅急送(顺丰不接受保价……)送了过去,40+邮费。。

然后当天在易迅和京东上下单,买了接近3K的硬件,周二陆续送到公司,和sandy同学当场组装。由于电源用的是sandy同学升级电源换下来的TT XP420,所以扛回家才把电源装上,然后居然木有点亮!坑爹啊!难道就这么杯具了吗!后来仔细看了下主板的说明书,发现好像是RESET/POWER的正负极接反了……坑爹的没有防呆化设计的针脚,哎……再桶了一下,终于把我攒的第一台电脑给点亮了……

另外由于某厂某活动送的某在线商城购物券实在没什么好买的,于是就买了个Edifier M17,反正我对音质没啥要求,这种能够插SD卡/U盘播MP3而且还带锂电池的音箱我一直挺想弄一个来着……

于是就比较舒畅地用了两个多月,直到泰国洪水发飙,发现硬盘的价格一路飙升……当初350买的硬盘,现在在淘宝商城已经涨到了690…………于是蛋疼地搜了一下各个配件现在的价格,发现现在配同样的机器要¥3441,比当初贵了¥330啊!于是蛋疼地开始考虑。。。为了结束实习回武汉以及再工作时的各种折腾,是不是把这台机器以不亏本的价格出掉,换一台笔记本………………

购买日期:2011-08-15
硬件                        现价    现价出处    购买价  购买处
AMD X3 450(3.2G,可开四核)  529    易迅        509    易迅
海盗船XMS3 DDR3-1600 4GB    180    淘宝商城    229    京东(缺货)
技嘉GA-880GM-USB3          588    易迅        599    京东(-50优惠?)
日立7k1000.d 1TB 单碟500G  690    淘宝商城    349    易迅(缺货)
TT XP420 350w电源          210    淘宝商城    ---    sandy
酷冷至尊RC-K100 ESATA      229    京东        229    京东
飞利浦19寸193E1SB(LED,DVI)  699    京东        729    京东
TP-Link WN781N无线网卡      88      易迅        89      易迅
微软IE3.0鼠标              168    易迅        169    易迅
戴尔8115键盘                40      淘宝        ---    sandy
天敏V801摄像头(带麦克风)    18.8    易迅        19      易迅
Dec 17

你可能不知道的鼠标键盘 不指定

felix021 @ 2010-12-17 14:59 [IT » 硬件] 评论(0) , 引用(0) , 阅读(4962) | Via 本站原创
选中:在文本段落上面,双击选中一个单词(或者一个汉字词组),然后再点击一次,就是选中一个段落。如果连续(较快速)两次点击且第二次不放开进行拖动,就是按单词进行选中;连续三次点击且第三次不放开进行拖动,则是按段落选中。选中某个文本区域(单击双击三击都可,单击的话就是选择开始点),然后在结束点按住shift+单击,就是把整块都选中,而且可以连续执行shift+单击,不用一直拖动鼠标在网页上面刷了。

Win7/Vista下面Win键+上下左右可以将当前窗口 最大化、左侧放置、右侧放置、最小化;WIN+SHIFT+左右是让窗口在多个屏幕之间移动;WIN+SPACE是可以临时看一下桌面,放开就恢复。拖动某个窗口摇一摇,其他窗口全部最小化,再摇一摇就回来。在文件夹空白处按住SHIFT右键单击,可以看到“在此处打开命令行窗口”。CTRL+Shift+N是新建文件夹。

大多数浏览器支持中键点击链接后台打开;中键点击TAB关闭;CTRL+W是关闭当前TAB(包括浏览器和资源管理器)。

ALT+SPACE打开窗口快捷菜单,ALT+D是切换到地址栏,ALT+PrintScreen是对当前窗口截图,CTRL+ESC打开开始菜单,CTRL+SHIFT+ESC打开任务管理器。

不知道有多少同学真正注意到开启Aero特效的VISTA/Win7下面按住WIN+TAB是有3D桌面效果的。

最后,可以安装个KeyTweak修改自己键盘的按键,比如把Insert修改成静音。
点击在新窗口中浏览此图片
Jun 4

ssh翻墙路由器打造计划 不指定

felix021 @ 2010-6-4 19:19 [IT » 硬件] 评论(2) , 引用(0) , 阅读(13320) | Via 本站原创
去年2月买的那个ASUS WL-520gu屈居普通路由器的角色已经很久了。由于今年由于各种失窃攒了众多RP,只剩下路由器可以折腾了,于是把它再翻出来。前一阵看到GFW Blog上总是在转载基于openvpn的翻墙路由器相关文章,于是也想搞一个自己的。但是vpn太贵了,ssh倒是正好,配合firefox的auto proxy或者chrome的proxy switchy,效果非常赞。OK,废话少说,切入正题。

需要的硬件:
1. ASUS wl-520gu,带有USB口的开源无线路由器,4Mflash,16Mram,200MHz brcm5354cpu。在 http://www.nslu2-linux.org/wiki/Optware/HomePage 提到的其他应该也OK。
2. 一个普通的U盘。256MB以上。

需要的软件:
1. Linux,貌似绕不过去,总得有的。
2. tomato固件
3. optware.rar

具体步骤:

1. 刷上tomato-1.23.8619-ND-USB-简体中文版.trx,可以在这里下载: http://dl.dbank.com/c0orlm04oj
刷好后在系统管理中开启ssh服务,从第四步开始需要ssh到服务器上操作。

2. 将U盘格式化成ext2或者ext3格式。这个在linux下很容易了,如果u盘是sdb,那么mkfs.ext3 /dev/sdb1就行。windows下可以用paragon partition manager来格式化,在这里下载 http://dl.dbank.com/c0ngokvdku

3. 下载optware.rar,将里面的tar.gz完整地解压到U盘的根目录下。
http://dl.dbank.com/c0zajdjmmp

4. ssh到路由器里头去挂载U盘的相关目录。
在wl-520gu下面U盘默认挂在/mnt/disc0_1,这个可以通过df命令查看到。
然后执行以下命令(就是rar包里的setting.sh的内容)
mount -o bind /mnt/disc0_1/opt /opt
mount -o bind /mnt/disc0_1/home /home

ln -sf /mnt/disc0_1/etc/profile /etc
ln -sf /mnt/disc0_1/etc/hosts /etc
ln -sf /mnt/disc0_1/etc/ipkg.conf /etc

5. 执行一些命令
/opt/bin/ipkg update
/opt/bin/ipkg install openssh
安装完毕以后执行
openssh-ssh -D 0.0.0.0:7070 ssh主机 -l ssh帐户
输入密码后即可连接上并开启sock5 proxy。
p.s. 不要直接输入ipkg,因为tomato固件里的ipkg不太对头,optware里面的才能用。

6. 让它更好用一些
/opt/bin/ipkg install keychain
ssh-keygen -t rsa
回车几下,会生成
/root/.ssh/id_rsa.pub
将此文件中的内容copy到ssh主机里 ~/.ssh/authorized_keys 文件中,下次就不用输入密码了。

可以用“screen -dm openssh-ssh -D 0.0.0.0:7070 ssh主机 -l ssh帐户”来进行连接,这样就不必一直开着连上路由器的终端了。

如果在 系统设置->脚本管理 的“开机脚本”里头加入
((sleep 60; screen -dm openssh-ssh -D 0.0.0.0:7070 felix021@qa.felix021.com;)&);
那么只要路由器开机联网后就能自动连上。

---------------分割线----------------

目前来说用的很好,嗯。不用在本机开着ssh了,很方便。因为ssh绑定的是0.0.0.0:7070,所以理论上只要知道路由器的IP,就可以在任何能连上路由器的地方使用这个proxy。

最后,希望这篇文章不要被发到GFW Blog上,我不想我的博客被墙=。=
Jan 29

炫一下:SmartQ V7全家福 不指定

felix021 @ 2010-1-29 13:29 [IT » 硬件] 评论(3) , 引用(0) , 阅读(5272) | Via 本站原创
SmartQ V7,水木行KB850迷你蓝牙键盘,百度无线鼠标,百度有啊兜兜台历。

点击在新窗口中浏览此图片
分页: 2/6 第一页 上页 1 2 3 4 5 6 下页 最后页 [ 显示模式: 摘要 | 列表 ]