写在世界杯前(一)

2010-06-03

还有八天,南非世界杯就将拉开帷幕,掐指算算,这将是我看的第四届世界杯。以往的三届世界杯当中,98年时晓伟年龄尚小,纯属看热闹;02年恰逢中考,没看几场球,不过这届杯赛也没有特别经典的战役;06年则没有错过几场关键的比赛,算是看得比较圆满的一届。

自从上大学以来,以往对足球的热情逐渐减退,直至毕业才发现,还真没完完整整地看过几场比赛。不过现在,我想该是捡起这个原始爱好的时候了,于是查询一下脑袋中陈旧的数据库,写些关于足球的文字。

没有人做过调查,但是似乎大家都承认巴西队是拥有球迷最多的国家队,然而晓伟偏偏对巴西不感冒。不喜欢一个球队需要理由吗?当然不需要,同样,喜欢一个球队也不需要理由。英格兰,是我最支持的球队;荷兰、阿根廷是我最欣赏的球队。至于支持和欣赏的区别,我想支持意味着感性色彩浓一些,欣赏则代表理性成分多一些。当九八年六月三十日,法国高弗里·吉沙尔球场,感性遭遇理性的时候,我选择了英格兰。

还记得这张照片吗?

照片中有三个著名球星,哥伦比亚的巴尔德拉玛、英格兰的贝克汉姆和欧文。5秒钟后

四天后……

在这张红牌20分钟前,迈克尔.欧文一球成名

看到图后正在奔跑中的22号萨内蒂了吗?国米的老队长,终于在今年圆梦捧起了冠军杯。

但是可恶的马拉多纳却不给他机会登上南非的赛场。难道阿根廷的中后场实力已经达到,连发挥最稳定,最有经验的球员也可以弃之不用的程度了?还是说,阿根廷队的锋线已经强大到无视任何后防的地步了?无论这届杯赛的结果如何,我敢说,不把萨内蒂带到南非,绝对是一个败笔!淘汰赛能够最终夺冠的球队,不一定有最强的锋线,但一定有最好的防线。

岁月不饶人,当年那场英阿大战的阵容中,如今多数人已经退役,小贝和欧文也没能登上去南非的末班车。本届杯赛,阿根廷分在B组,英格兰在C组,如果两队能顺利拿到小组第一,那期待中的英阿大战将只可能在决赛上演,如果有一方出现了意外,很有可能在1/4决赛中两队就将狭路相逢。

=====================华丽的分割线===============================

阿根廷的赛程:

6月12日 星期六 22:00 阿根廷 VS 尼日利亚

98年非洲雄鹰展翅高飞,如今12年过去,值得期待……

6月17日 星期四 19:30 阿根廷 VS 韩国

看好韩国能攻破阿根廷的球门

6月23日 星期三 02:30 阿根廷 VS 希腊

老马在94世界杯上的最后一场比赛,对手就是希腊,赛后老马服用禁药遭禁赛,如今再次面对希腊,莫非奥托大帝再上演一次希腊神话?

英格兰的赛程:

6月13日 星期日 02:30 英格兰 VS 美国

看看小贝的无间道水平如何

6月19日 星期六 02:30 英格兰 VS 阿尔及利亚

阿尔及利亚,没听说过这国家?齐达内童鞋可有阿尔及利亚血统,嘿嘿,不过此战英格兰应该能顺利过关。

6月23日 星期三 22:00 英格兰 VS 斯洛文尼亚

很难想像,如果南斯拉夫仍然是当年那个统一的国家,他的足球水平得有多强大,哈哈,YY一下

Ubuntu下配置VIM作为R的编辑器

2010-05-27

前面写过一篇《选择R编辑器的折腾过程》,如题目所述,主要讲述折腾过程,而没有写折腾结果,这篇文章补上。首先把我们将要实现的效果说明一下,语法高亮,代码自动缩进,自动补全,利用VIM和它的两个插件,可以在一个终端窗口内,实现VIM和R的交互,单行向R发送代码,VISUAL模式下,选中代码向R发送,这是我们最常用到的两个功能。

VIM就不作介绍了,网上的文章一大堆,自己google就行。准备工具:看本文题目,首先你得装个ubuntu吧,版本?最新的10.04就行。利用安装盘,或者硬盘安装(可参考怡轩的文章) ,或者使用VMWare虚拟机安装(这个东东可以从我国最大的盗版软件集散地上下载,全网资源结果中的700+评论的那个)。正常情况下ubuntu是应该自带VIM的,这里是VIM不是gVIM,前者只要你在终端里输入vim就可以打开,后者则要另外安装,并且在新的窗口中打开。推荐用终端下的vim,个人感觉配色更加舒服。VIM的两个插件,一个是vim-r-plugin2,在这里下载,一个是screen.vim,在这里下载。最后,主角登场,R,在新立得里安装就可以。

VIM的配置文件是这个,~/.vimrc,如果没有,自己新建一个就OK。然后用命令mkdir -p ~/.vim 建一个目录,用来存放VIM的插件文件。注意这两个名字前都有一个半角的句点,也就是说它们是隐藏文件,平时是看不到它们的。调出它们有两个方法,1.在文件管理器下,按CTRL+H;2,在终端下输入ls -a。查看一下这两个东东是否新建成功。

如果你没有修改过浏览器的下载目录,刚才的两个插件应该下载到了Downloads目录下,在终端下进入这个目录,然后输入命令,
tar -xvzf vim-r-plugin2-*.tar.gz -C ~/.vim 这一步是要把vim-r-plugin2的文件解压到新建的插件目录中,然后再用命令vim screen.vba打开刚才下载的screen.vba文件,在打开的文件中按:(冒号)进入VIM的命令模型下,输入so %回车(中间有个空格),把这个插件也安装上。最后进行配置过程,vim ~/.vimrc打开刚才新建的这个配置文件,往里添东西,添的东西可以在网上找,但是至少下面两句是必不可少的:
filetype plugin indent on(这句是要我们的插件和代码缩进起作用)
let g:vimrplugin_screenplugin = 1(我的系统是gnome终端,所以取值为1,如果不符合你的习惯可以改成其它,相关的参考vim-r-plugin2的帮助文件,~/.vim/doc/r-plugin.txt)
下面是我的配置文件内容

set nocompatible
set backspace=indent,eol,start
set history=50
set showcmd

syntax enable
syntax on

colorscheme evening

set guifont=Courier\ 14
set guifontwide=永中宋体\ 14

set enc=utf-8
set nu!

filetype plugin indent on

set cindent shiftwidth=4
set autoindent
set tabstop=4
set langmenu=zh_CN.UTF-8
set fileencodings=utf-8,gb18030,utf-16,big5,gb2312,GBK
set nobackup

let g:vimrplugin_screenplugin = 1
let g:vimrplugin_underscore = 1
let g:vimrplugin_nosingler = 1
let g:vimrplugin_noscreenrc = 1

map <F3> a()<Esc>i
map <F4> a""<Esc>i

添加完毕后,保存退出。随便找个位置建一个以r为后缀(这个很关键,否则插件不起作用)的文件,比如test.r,再用vim test.r打开这个文件。在VIM的命令模式下,分别键入两条命令,helptags ~/.vim/doc ,和RUpdateObjList,这样就建立了tags文件,能够使用函数的自动补全功能了。此时在VIM普通模式下输入\rf后,应该就会出现下面的效果图了。


大功告成,开始后话,也是实话。VIM不太好学,它的学习曲线很陡,只有练习一段时间后它的威力才能显现出来,如果没耐心经历这个过程,可以移步到其它的编辑器上,没必要在一棵树上吊死。学习的过程中,一定要勤看帮助文件r-plugin.txt,当然要在一定的VIM基础上看。如果遇到问题,可以联系晓伟,虽然本人才疏学浅,不一定能解决问题,但是至少也能提供一些有益的经验。有诗为证:同是太涯折腾人,相逢何必曾相识。

山海关一游

2010-05-12

长假漫漫,无心学习,于是乎晓伟北上到渤海边,一来去某个重要地方,二来顺便转转其他几个不重要的地方,山海关就是其中之一。

众所周知,自秦代起,历朝历代几乎都曾经修过长城,一直延续到今天。但是,高高的城墙没有挡住北方强盛民族的进攻,我们汉族祖先两次亡国,数次被屠杀!年少无知的我们,怎能体会到“王师北定中原日,家祭勿忘告乃翁。”所表达的那份沉重。如今,这曾经用无数生命代价修筑起来的长城,竟然成了供人们游玩观赏的对象,如果秦始皇泉下有知,一定会感慨“哥修的不是长城,是寂寞”。

记得小学时候有篇文章写的就是长城,当时我们的语文老师是个五十多岁的老太太,她想找《长城长》这首歌来帮助教学,但是又想不起来这首歌的名字了。于是问自己的小儿子,“长城这个歌怎么唱?”,她的小儿子是个黄家驹迷,一时没反应过来,脱口而出”遥远的东方,辽阔的边疆,还有远古的破墙。“把老太太当场雷倒……

虽然城墙很破,但是票价却不低,还好有熟人,可以免费上去参观。上城墙的路很宽,两边是台阶,中间是倾斜的道。这点和故宫有点像,两边台阶,中间道,听导游说,两边的路是文官走的,中间的道是武官走的。我怀疑马失前蹄这个成语,可能就是某位武官从中道上滚下来后发明的。上城墙后才发现,原来城墙上更宽,传说中可以并排行走十人。从墙头往下看,还真有点晕。想想古代时候攻城的场景,不知道得有多惨烈。这么高的城墙,无论城墙下的人采取什么样的自杀式袭击,都无济于事,即使攻下,也必然死伤无数。突然有一个很奇怪的想法,如果基地组织的人回到古代,用自杀性爆炸袭击来攻城,那又是怎样的一副场景呢?

沿着城墙边走,很快就到了城楼,也是著名的天下第一关。外地人如果想近距离参观它,要花费八十元,相当于三个正版win7序列号的价格。至于本地人,则只需五元,相当于一张盗版win7的零售价。城楼有两层高,但只有一层对外开放。楼外门上挂着非著名的天下第一关匾,不过这个是盗版的,正版的在城楼内。看看,正版的售后服务就是好,住着二层小别墅,不像盗版兄弟,天天在外面风吹日晒的。但是,盗版兄弟非常白净,正版哥们却已经十分破旧了,看来时间的侵蚀力要远大于风雨。不恰当加上两句诗“光阴荏苒须当惜,风雨阴晴任变迁。”和这座著名的城楼一样,这块非著名的匾也是有故事的人。相传写这块匾的人,名叫萧显,写这五个字用了一个月,临到上级来检查的时候,发现下字还缺一点。情急之下,用抹布蘸上墨汁,用尽力气向匾上一扔,完成了这最后一点,这就是传说中的神来之笔。

最后就要说说这座城楼曾经的守将,吴三桂。又想到一个成语吧?没错,冲冠一怒为红颜。这个故事的真实性,我感觉值得怀疑。个人认为,他的确冲冠了,但应该不是为了红颜,而是权力。但这已经不重要了,况且并不是所有的东西都能用理性来进行分析的。就像另一个近代史上著名的人物,汪精卫,一个在二十岁时写下“引刀成一快,不负少年头。”的革命志士,最后却写下“纵有先辈尝炎凉,量无后人续春秋。”的悲凉诗句,仅仅用汉奸一个词就把这个人一扳拍死,里面又有多少理性成分,多少感性成分呢?不过,他俩地结局都一样,很杯具。站在城楼上,一幕幕历史都仿佛真实在眼前展开,一切又只是过往云烟。只有破旧的城墙告诉我,这一切,都曾经真实的发生过。历史不是虚构的,更不是电视剧,它真真实实地发生过,关键是我们能否有意识地去发现,去思考这些,而不仅仅只是人云亦云,停留在书本上。古人其实早就告诉我们了,读万卷书,行万里路。

谈谈怎样学习五笔

2010-05-12

大约在十多年前,那时候网络还没有现在这么普及,确切地说微软的office还没有一统江湖,很多人用的都是国产的金山WPS,DOS的系统。蓝色的界面,没有鼠标,这种场景如果现在出现在你的电脑屏幕上,估计很多人都会以为自己的系统已经崩溃了。当时所用的输入法,说实话我已经记不太清楚了,貌似是全拼,也似乎好像有智能ABC,当然还有经典的原版王码五笔86版,我的五笔学习就是从这版开始的。

那时候接触电脑的人,即便不会用五笔,也必然听说过这两句口诀“王旁青头戋五一,土士二干十寸雨”,这就是五笔字型字根大法的前两句(还好不是“武林称雄,挥刀自宫”)。世上有很多事情,在达到融会贯通的境界前,必然要经历一个死记硬背的过程,五笔也不例外,事实上,即便是像我现在已经全面改用五笔五年了,也并不是所有的汉字都会用五笔打的。

最初学习五笔的时候,字根表是一定要烂熟于胸的(尽管现在我已经忘得差不多了)。这个过程并不难,因为只要记忆力正常,都应该能背下来。然后一般的五笔教材就会告诉你要开始学习一级简码,也就是用一个键加空格就可以打出的汉字,一共有25个(不包括Z)。还有二级简码,就是敲两个键加一个空格就能打出来的汉字,其实按我的经验来说,一级简码可以记一下,二级简码就比较扯淡了,现在的字库容量这么大,谁能记得住打两个键出什么字?反正我是记不住。所以我看完了一级简码的二十五个字,就开始学习拆字,这是一个痛苦的过程,我想大部分人都会在这时候选择放弃,但是只要坚持过来,就可以说五笔学习成功了一大半了。

我是怎么度过这个过程的呢?谢天谢地,当时家里没买电脑,但是有一件绝世武器,电子字典!为什么这么说呢?因为我当时还在上高中,平时可没时间也没机会碰电脑。但是,同各位屏幕前的童鞋一样,我每天也必须要花十分钟时间到一个地方,这个地方你不能带电脑进去,但是电子字典可以进去,嘿嘿,这时候电子字典可比电脑还要强大。每天不多,就打十个字,而且电子字典都很“笨”,经常出一样的字来测试你,第一次遇见不会(看答案),第二次有点印像(再看答案),第三次,恭喜你都会抢答了!时间久了,十分钟内你可不止只打十个字了,可能是五六十个,也可能更多,要相信日积月累的力量是很可怕的!当电子词典难不住你的时候,就是开始进阶篇——打词语的时候了,单字会拆,词语就只是勤加练习的问题了。

呵呵,虽说现在对五笔感兴趣的人可能不多了,不过作为最好的汉字形码输入法,五笔的生命力还是很强的。在充斥了拼音输入法的网络世界里,用五笔给脑袋换个思维方式也不错,而且现在的输入法要比较以前的原始86版强大得多。字不会打,可以先打拼音,反查五笔编码。我曾经用过的五笔输入法有:原始86版、万能五笔、极品五笔、搜狗五笔、极点五笔、小鸭五笔,现在用的是QQ五笔。腾讯这个公司很神奇,虽说他的产品大都不是原创的,但是不得不承认,他抄得出神入化,用着就是很舒服,我比较推荐QQ五笔,以后也会一直用它。在Linux下,不得不多说几句,上个月重装了Ubuntu,自带的输入法从SCIM换到了Ibus,本以为会有很大提高,结果更难用了,现在换回了fcitx小企鹅输入法,功能虽然与WIN下的输入法没法比,毕竟一个是志愿者开发维护,一个是RMB团队开发维护,但是在Ubuntu下用五笔,已经是一个不错的选择了,有没有更好的?现在没碰到,以后可能有。

选择R编辑器的折腾过程

2010-05-12

2009年是自己比较失意的一年,算是在人生之路上摔了个大跤,还好小筋的身子骨比较硬朗,今年又爬起来了。记得《奋斗》书后有几段话,其中一段是米同志她爸说的,“有的时候人会摔一跤,趁这个机会应该回头看一看,看看自己曾经走过的路,用不着匆匆忙忙往前走。”跑题结束,下面切入正文。

R是统计专业居家旅行,生活学习必备语言,至少我这么认为的,嘿嘿。R的编辑器有很多,哦,这里要说明一下,我这里的编辑器,也包括很多的GUI,相关的可以参考 R GUI Project。

大多数人用的第一个R编辑器,应该是从R镜像站中下载下来的,那个30多M的软件包自带的。但是要区别清楚,这个东东可不是R,它只是R的一个比较粗糙的“壳”,一个简易的GUI,我们的R旅程就是从它开始的。这个GUI的菜单栏比较适合初学者,提供了很多命令选项,还有帮助文档。如果要批量写代码的话,可以打开代码编辑器,有按行,或者批量发送代码的功能。客观来讲,这个编辑器足够应对平时的使用,但是没有语法高亮,也不支持自动缩进和自动补全,所以大部分人都选择了跳槽。

对于新手朋友来说,原始的GUI还是有些麻烦,还得输命令,有没有像SPSS一样的R呢?开始用R的时候不知道,后来发现还真有人做这个,叫做R commander包,真把R部分傻瓜化了,非常适合新手使用。不过,时间久了后,就会有些不满意它的条条框框,点来点去,而且R的魅力并不在鼠标,要和SPSS比谁更SPSS?R肯定不是对手 ,怎么办?“走吧,走吧,人总要学着自己长大。”换个地方去探索R。

这时候许多人都会来到另一个WINDOWS下用的GUI,Tinn-R,它也不大10M左右,如果用腻了原始的那个GUI,它是WIN下一个不错的选择。同样的还有一些基于JAVA的跨平台的GUI,像JGR,还有著名的IDE,Eclipse。这两个东东我都用过,不过都舍弃了。JGR,相信我,你肯定用不习惯的。Eclipse下有个插件是关于统计方面的,的确很强大,语法高亮,自动补全都支持,可以说相当perfect,但是我可怜的小本单核1.73G,开着Eclipse,转得和锅炉一般,内存使用也飙升,实在不忍心这么折磨它,只好弃之不用。

于是在2008年下半年的某天,我抽风地非要试试Linux,装上了传说中的红旗Linux,而后的经历不忍叙述,最终结果是换到了Ubuntu。没有安装盘,使用的虚拟机Vmware安装成功,从此开始了Linux下的折腾。此后又尝试了Emacs和VIM,最终定型使用VIM,原因可能比较雷人:实在懒得再装软件了。要理解我为什么这么想,只要看看我的折腾经历就明白了。装上Ubuntu后,默认gnome桌面系统,误删软件导致图形系统崩溃两次,重装,每次都得下载200M左右的文件,而我的网速只有1M,重装一次就要耗费一下午。为了使用RKward,换到了KDE桌面,用不习惯又简约化,使用Xfce桌面,又误删软件导致崩溃,而后电脑搁置了七个月没用,期间经历了艰苦的考研历程。考研成功后终于大彻大悟,不再折腾,电脑里只留一个VIM,虽然水平很菜,但是可以逐渐学习,核心的原则只有一个:写代码我就认它了,实在是折腾不动了。

接开头一段,呵呵,去年跌倒后,我总结了一下自己失败的原因,很简单,两个字:浮燥!其实,我上面的折腾经历已经从一个侧面反应出了我当时的浮燥心态,真正的R水平没有提高,编辑器却用了一堆,这是典型的舍本逐末,有折腾编辑器的时间,即便是全在命令行下操作,功力也绝对要高现在N个档次。但是细细一想,就算我的R用得出神入化,我自身的统计知识如果不能随之增加,那也是没有意义的。浮燥的心态怎么可能学到真正的知识呢,我应该好好地反省一下了!

昨天重做的Blog,今天补个图:

关于跆拳道

2010-05-12

今天要帮领导准备英语自我介绍的材料,基本的内容之外,还要加上对所学专业的简介和理解。领导是练跆拳道的,自然就需要写跆拳道方面的东西。

自从四年前的某天起,我就时刻处在变身成为跆拳道踢靶的危险中,所幸至今还未变身成功。在大众的印像中,跆拳道是和两个字分不开的,啊猜,这两个字的正确念法是这样的,(以下为汉语拼音)a,cai~ai~ai,有时也念作 ba,cai,不管怎么念,主要目的都是一个:一定要在气势上压倒对方。人们也经常有个误区,认为跆拳道是比较暴力的运动,比如在别人听说我领导是跆拳道专项后,表情的变化大体都先是吃惊,后是同情。其实,你们大可不必担心我的人身安全,因为跆拳道是讲礼仪,注重内心休养的运动,我想这也是为什么许多家长会送孩子去学跆拳道,而极少有人愿意让孩子接触散打,拳击训练的原因。

在韩语中,跆,是用腿击打的意思,跆拳道技术也主要以腿法为主。有些技术动作看似简单,实际上却不容易。比如前几日陪领导训练时,我负责拿靶,练后踢,领导的动作干净利落,而我的动作则像,“小狗撒尿”,很囧。拳,自然就是用拳击打的意思,跆拳道中也有少量的拳法,主要是正面的冲拳。道,也就是我前面说到的内心休养,也是跆拳道区别于其他运动的重要特点。这个东西让我想起了武侠小说里的情节,《天龙八部》中,鸠摩智用小无相功打出了假的少林七十二绝技,方丈十分吃惊,说少林寺创建以来只有达摩祖师一人身兼七十二绝技,这其中的原因并不在武功本身,而在于佛法境界的高低。寺中有位玄澄大师练成十三项绝技,不过佛法境界不够,以致走火入魔。我想这和跆拳道有异曲同工之妙,听着有些玄乎,不过实际中也能找到类似的例子,清华大学的校训,“自强不息,厚德载物”。练武练的是一种精神,不是怎么样战胜别人,击倒人最好的方法是用AK47,杀伤力大,而且便宜,耐用。

很多人问我领导练到了什么级别,这个问题我到今天才弄明白,准确地说是黑带二段。跆拳道的级别分为十段十级,段级的人是黑带,黑带中也分十段,所以一般你看到的穿道服的人,都系着其他色的腰带,证明尚处在十级之内,还没有到段的级别。最后还有一个问题,练跆拳道对防身有无益处?很多人说这些都是花拳绣腿,到实际中就没用了。我觉得这种说法有失公正,实际中的打斗,其实就是勇气,力量,速度,反应能力的综合表现,跆拳道就可以提高这些能力,当然,效果要因人而异。

我认真地想了想,人这辈子似乎只有这身体是暂时属于自己的,所以,一定要多多锻炼,好好保护自己仅有的这点“财产”。

2010人大统计学专业课考研经验

2010-05-12

2010年的考研步入尾声,不少同学已经开始着手准备2011年研究生考试。考研是个艰苦的过程,对毅力,体力等多方面都是一个巨大的考验,当然正确的复习方法也是必不可少的。本文是我两次考研经历所总结的经验之谈,其中有我自己所使用的复习方法,加上我的一些思考总结,读者可以借鉴为自身所用,但切记不可盲目照搬,原因请见小学课本文章《小马过河》。

如果有人问我,考验中最重要的因素是什么?我的回答是,坚定的决心。如果翻译成计算机代码的话,我想可以这样写if (determination == T) {…} else result = “failure”;(很不幸,09年我的determination值取F,所以09年的结果就failure了)。理性的决心是考研成功的先决条件,注意决心要加一个定语,盲目的决心可能会带来失败的结果。那么什么样的决心是建立在理性基础之上的呢?我们的孙子曾经曰过“知已知彼,百战不殆”,理性就是要客观地评估自己的实力与报考学校专业的要求之间的差距。自然的,首先我要看看它的招生人数和报考人数,这是个很实际的问题。人民大学统计学院今年的拟录取人数是75人,其中统考占41人,而参加统考的人数通常在240+以上。其次要看它的分数线,具体的可以到网上查,我的印像里奇数年350左右,偶数年360左右。单科线,其实主要就是英语,如果政治不能过线,那你一定是稀有品种,或者你考前肯定忘记了拜春哥。英语的线,60以上保过,55以上烧香,55以下没戏,不过如果当年线刚好55,而你总分又奇高,可能有希望。简而言之,人大有风险,报考须谨慎。

公共课的复习,网上有太多资料,我在这里只说一下自己的专业课复习经验。关于专业课科目,人大的招生简章写得很模糊,只说是统计学综合,至于具体是谁和谁综合,综合到什么程度呢?没考过的人肯定很头疼,不过童鞋们不用担心,且听我慢慢道来。

出题可真是个技术活,如果像10英语一样搞砸了,网上的咒骂铺天盖地,那可就太不和谐了。我想出题人追求的效果应该是稳定,即区分度要相同,10年的英语就烂在这里,区分度太差,复习效果似乎和最后分数没多大关系。注意,稳定不可能是绝对的稳定,而是相对的稳定,我的理解是出题的风格,难度,范围,三者要稳定。具体到人大统计学专业来说,风格很活,难度重基础概念的理解和把握。至于范围,如果作一个重要性排序的话,我要用五人制足球来类比一下。五人制足球场上包括守门员共有五人,阵形分4-0,3-1,2-2三种,人大专业课出题阵形应该属后两种。下面让我为大家来介绍一下专业课足球队的人员构成:

《统计学》(人大版)这本书是教练兼守门员,是整支队伍的大脑和最重要的一道关卡,在近几年的初试比赛中,他都会做出两到三次精彩扑救。助理教练是《非参数统计》,因为教练方面没有提供到非参数思想,而这种基础的统计思想是非常重要的,在教练无计可施时,就是它开始帮助“找理由”的时候了。而后是《应用回归分析》(人大版)和《多元统计分析》(北大高惠璇版),有时候是单箭头,比如09年考应用回归多些,而10年则倾向于多元统计分析,另外在场上的两本书是《时间序列分析》和《抽样技术》(人大版)。替补队员有,《国民经济核算》,他自05年从初试退役后,尚未有复出迹象,不过在复试时会简单亮个像。《经济社会统计》,他只在05年前的某年初试决赛中登场一次,后因恶意犯规被红牌罚下,被禁赛至今。但没有证据表明是终身禁赛,所以请各位时间有富余的考生买一副好的护腿板,防止小概率事件发生。

专业课的书虽然多,但并不是要求每个细节知识点都要看到,毕竟我们是凡人,不是神。我采取的方法是抓主干,有重点的各个击破。首先说《统计学》,这本书中间的概率统计部分是可以不看的(千万别说你没学过概率论与数理统计),回归部分也可以一笔带过,因为有《应用回归分析》会详细阐述。重点部分是数据的搜集和展示(此处推荐结合上机操作,用R,或者EXCEL也行),概括性度量,参数估计,假设检验,列联分析和方差分析。在看这几部分时,不能满足于只看懂书上的内容,要适当的做一些拓展,我比较喜欢英文的维基百科,上面的统计学方面的内容要比中文版的好很多,同时也可以增加一些专业英语词汇,足以应对复试中的英语笔试,一举两得。《多元统计分析》,这个我用的北大高惠璇版的,先看一些多元方面的运算法则,然后重点是判别、聚类、因子分析、主成分分析,这四部分最好实际上机操作一下,呵呵,我的抽象思维能力不足,比较喜欢动手去做。这四分部重点内容不仅要看懂,更要思考,多问几个为什么,搞清楚它们的前提假设,主要思想,方法过程,还有各自之间的联系和区别。比如说“判别分析和聚类分析的区别是什么?”,这个题在10年考研初试和复试中竟然都出现了。同样的,你可以问自己,“因子分析和主成分分析有啥子区别呢?”。而后面的典型相关分析、对应分析、偏最小二乘,这三部分不用看太细,但要明白他们的背景和用途。

接下来就是《应用回归分析》,其实多元回归方法也是多元统计分析方法的一种,不过Galton同志发明regression这个词时,其他的多元统计方法还尚未出世。前面之所以要看一些多元变量计算的法则,也是在为这部分做准备。回归分析的重点部分我觉得就是两部分,随机误差项,多重共线性,呵呵,其实这两部分任意一个都足以写N本专著来详加论述。我的方法是,看东西要搞清它的来龙去脉,大致是这么一个过程,随机误差项这东西它从哪儿来,为什么来,为什么要有经典回归模型的假设,不满足经典回归模型假定的时候会出现什么情况,出现了怎么修正等等。往年的试题中,回归分析都是产分大户,不过今年似乎有些“非主流”,回归分析所占分值不多,如果没有记错,只有复试时有一道题。同样在今年遭受冷遇的还有方差分析,呵呵,全都是超级经典基础方法,作为统计系的学生,不认真掌握它们,说不过去吧?

《时间序列分析》在近几年逐渐走红,考察过的知识点有:平稳的定义和意义(一定、绝对、必须熟练地掌握),Box-Jenkins模型的思想(常用马甲:ARIMA 模型),再加上《统计学》后面关于时间序列那一章的内容。我个人认为,重点还是在模型的应用背景,主要假设条件、思想和方法。仅针对于这一门考试来讲,千万别纠结于繁琐的代数运算,但是基础的数学演绎推理证明能力还是应该具备的,当然如果要立志成为统计学大牛,强悍的数学能力是不可获缺的。接下来就是回忆《一道抽样试题引发的血案》的时刻,凶手是2005年1月某日下午统计学初试考卷上的一道《抽样技术》试题,此题集多个知识点于一身,内含基本方法之应用,外辅数学计算之繁琐,伤人无数。(详情请见COS统计之都邮箱中附件)此题开《抽样技术》计算题之先河,在09年,又再次展现它的杀伤力,风采不减当年。不过各位童鞋不用担心,再厉害的高手也有软肋,只要我们基础过硬,就可以战胜它们。这本书如果要出理论说明题,那范围很广,但是出计算题的范围,嘿嘿,相当窄!归纳起来就三个地方,分别是简单随机抽样,分层随机抽样和系统抽样,其中简单随机抽样和分层随机抽样一定要熟练掌握。如果你认真做过《抽样技术》(人大金勇进版)这本书的课后题,那对09年的那道抽样初试试题就一定不会陌生,只不过是把原题换成了比例数据,然后把比例分配换成了内曼分配。从这里我们也能看出考试出题的一个方向,保证试题的每部分你都见过,但是整合到一起就成了一道全新的试题。当然,经常有课后原题直接只字不改出现在试卷上的情况,遇到这种情况,没说的,直接秒杀之。

最后就是比较有争议的三本书,《非参数统计》,《国民经济核算》,《经济社会统计》。首先要说明,《经济社会统计》这本书我没有看,原因有二:一,我是从09年8月准备的二战,不属于时间有富余童鞋的行列;二,确实不知道重点在哪儿。《国民经济核算》这本书,我认为重点是生产核算(GDP)和国际收支平衡表部分(BOP)。但是,国民经济是一个整体,就像一个生产流水线一样,我觉得还是有必要系统地学一下。再有,普通人理解上的统计学,其实就是国民经济核算,但让我十分不解的是:许多人分不清统计和会计,认为统计就是算账,看来我国的统计教育任重而道远。《非参数统计》,个人认为以后会逐渐地加强考察,今年的初试和复试题中,又有一道相同的题(汗一下),大意就是如何检验一组数据是否服从正态分布。再一次强调,还是注重基本思想和方法,计算要弱化一下,试想如果让你作一个wilcoxon秩和检验,不仅计算麻烦,还得给你W统计量分布表,人大老师出题可是惜字如金的,往往题干都是“一句话的事”。

OK,上面就是本人对于专业课复习的一些拙见,纯属一家之言,仅供参考。细心的童鞋已经发现,其实我的方法可以归结成一句话:以往年试题为基准,向-右-看-齐!呵呵,其实我本人是最讨厌应试的,直接导致了09年的惨败,我们对于知识的追求,岂能由几张试卷来做导向?但是,考试就得这么来,就好像一个武林高手,十八般武艺样样精通,但是如果让他来参加中国的散打联赛,结果只有一个,场场因为犯规被罚下。为了未来更自由,只能先忍耐暂时的束缚,你可以把这个过程当作是巩固自己专业基础知识的过程,that’s all。考研是个过程,一定要坚持,引用谢站长的博客标题”Keep On Fighting”,切记不要急于求成,一口吃不成个胖子,但胖子确实是一口一口吃成的。

最后,感谢COS在我考研过程中对我的帮助,感谢COS各位版主的辛勤劳动和无私奉献,祝愿COS的明天越来越好!

前言

2010-05-12

经过了接近一天的折磨,晓伟的blog beta1.0 终于研制成功。界面虽然还很粗糙,后台也比较乱,但是本版本正处于事业的上升期,改进空间还是相当大滴。

作为一个生活中较低调的人,时常有童鞋说本人几乎音信全无,不过自本站开启之日起,这种情况将一去不复返了。本着勤劳致富的原则,我会时常更新博客,也请各位童鞋闲暇时间来本站做客。别担心,没有防盗门,也没有恶犬,更无需破窗而入,进入的方法很简单,在浏览器地址栏中键入blog496.org 即可。496这个数字很好记,PS:这是一个完美数。

祝愿大家身体健康,学习进步,工作顺利!