<?xml version="1.0" encoding="GBK" ?>
<rss version="2.0" xmlns:slash="http://purl.org/rss/1.0/modules/slash/" xmlns:dcterms="http://purl.org/dc/terms/">
 <channel>
  	  <title><![CDATA[fly的博客]]></title>
	  <link>http://mjliao.blog.163.com</link>
	  <description><![CDATA[国事、家事，事事关心 致力于

            游戏开发、仿真、虚拟现实]]></description>
	  <language>zh-CN</language>
	  <pubDate>Fri, 18 Jul 2008 20:05:07 +0800</pubDate>
	  <lastBuildDate>Fri, 18 Jul 2008 20:05:07 +0800</lastBuildDate>
	  <docs>http://blogs.law.harvard.edu/tech/rss</docs>
	  <generator><![CDATA[NetEase Space]]></generator>
	  <managingEditor><![CDATA[mjliao]]></managingEditor>
	  <webMaster><![CDATA[mjliao]]></webMaster>
		  <ttl>120</ttl>
	  <image>
	  	<title><![CDATA[fly的博客]]></title>
	  	<url>http://ava.blog.163.com/photo/Jy9qsh5PVxliX07l68SCxw==/330451622658744509.jpg</url>
	  	<link>http://mjliao.blog.163.com</link>
	  </image>
  <item>
  	<title><![CDATA[中国地球物理学会顾问陈一文  :  中国地震局负有不可推卸的责任 ]]></title>	
    <link>http://mjliao.blog.163.com/blog/static/37535193200842975116261</link>
    <description><![CDATA[<div><P style="TEXT-INDENT: 2em"></P>
<P style="TEXT-INDENT: 2em">&nbsp;&nbsp;&nbsp; </P>
<P style="TEXT-INDENT: 2em">&nbsp;</P>
<P style="TEXT-INDENT: 2em">摘自：<A href="http://www.wwwwshop.cn/html/yinshijiankang/200805/21-431.html">http://www.wwwwshop.cn/html/yinshijiankang/200805/21-431.html</A></P>
<P style="TEXT-INDENT: 2em">中国地球物理学会顾问陈一文&nbsp;&nbsp;:&nbsp;&nbsp;中国地震局负有不可推卸的责任 </P>
<P style="TEXT-INDENT: 2em">广东网友朱健国争鸣文章： “汶川5、12大地震”到底事前有没有人预报？中国地震局负责人近日对媒体的说法是，既不可能，也从来没有收到任何预报。但中国地球物理学会天灾预测专业委员会顾问陈一文则怒斥中国地震局此言为谎言，在中央电视台的节目中明确说：“中国地震局负有不可推卸的责任！”——2008年5月18日15时许，陈一文在通过电话向笔者说明有关背景后，又传来了一段简明的备忘录。 </P>
<P style="TEXT-INDENT: 2em">5月14日，中央电视台CCTV9频道英语节目有一个讨论“汶川5、12 大地震”的嘉宾访谈节目，在有关专家涉及到汶川地震造成如此巨大伤亡是否有个责任问题时，主持人杨瑞说，我们现在联线一位权威人物就此发表意见，他是中国地球物理学会天灾预测专业委员会顾问陈一文先生。于是陈一文通过电话用英语回答：中国地震局负有不可推卸的责任！从2006年三年来，天灾预测专业委员会就汶川地区可能发生强震，曾经向中国地震局提出过三次中期预测，特别是2008年5月3日，陈一文亲手又向中国地震局发了一份汶川地区可能发生强震的预报。据陈一文所知，还有其他人也向中国地震局提出过汶川地区可能发生强震预测。但是，这些严肃科学的预报一再泥牛入海无回音，中国地震局的领导与中国地震预测研究所的所长们从来没有就预报访问过天灾预测专业委员会的专家，从来没有深入了解过他们地震预测的工作。因此，中国地震局的领导们现在称也从来没有收到任何预报，完全是胡说八道的谎言。 </P>
<P style="TEXT-INDENT: 2em">尽管当天晚上央视重播这个节目时，因压力将陈一文上述意见删除，但是由于当时的节目是实播，陈一文关于“中国地震局对汶川5、12大地震负有不可推卸的责任”的信息已通过央视揭露于全世界！陈一文至今坚持自己的观点有理有据，符合“科学发展观”。陈一文补充说，与“汶川5、12大地震”的实际震中相比，他们的预报在经度上只相差一度，基本准确。陈一文欢迎各媒体和网站转载他的观点——《陈一文顾问网站》（<A href="http://cheniwan.sea3000.net/">http://cheniwan.sea3000.net</A>）上的《地震预测》专栏与《科学共同体及其规则》专栏中，有他对中国地震局的所作所为有大量评论与附录。 </P>
<P style="TEXT-INDENT: 2em">据悉，中国地球物理学会天灾预测专业委员会拥有曾准确预报了唐山大地震的一批着名专家，如郭增建教授、汪成民教授、耿庆国教授、黄相宁副研究员、徐道一研究员、徐好民研究员、张网厚研究员、强祖基教授、曾小苹研究员、钱复业研究员、赵玉林研究员和地震预测专家孙威等。 </P>
<P style="TEXT-INDENT: 2em">陈一文是孙中山的秘书陈友仁之孙 </P>
<P style="TEXT-INDENT: 2em">陈一文困惑的是，他不仅是个有一定知名度的专家，而且出身名门，乃孙中山的秘书陈友仁之孙，周恩来、宋庆龄、康克清当年或给他亲笔写信，或当面鼓励他积极为建设新中国建言献策，为什么今日竟然不能将事关千万人民生命的地震预报上达主管部门？陈一文虽然属于英籍犹太人（母亲为犹太人，亦可称英籍犹太人，犹太人以母亲血缘为准），但对新中国感情深厚——祖父陈友仁既是孙中山先生亲密的外事秘书、顾问，也是杰出的爱国外交家，曾于1926-1927年担任广州国民政府与武汉国民政府外交部长，1927年曾与毛泽东、宋庆龄等人在汉口举行国民党中央委员会会议时合影；他虽然1942年出生于英国，1950年因父亲陈依范（英籍新闻工作者、1938年与1946年访问过延安，1947年协助新华社创办伦敦分社）应邀来新中国帮助新华社开展对外宣传工作，随父从英国伦敦定居北京；1968年毕业于北京机械学院后，在原一机部抚顺挖掘机厂从事生产劳动、技术革新工作、技术情报研究工作；1979调回北京安排在中国机械设备进出口总公司工作；1980年代初担任全国青联一机部系统特邀委员；1981年至 2000年，担任〔美国〕嘉利华公司驻北京联络处首席代表，后为北京市凯利华信息咨询有限责任公司总经理；自1990年以来开始跟踪调查研究中国地震预测实践研究者自主创新科技成果的发展及其遭遇的困难与阻力，2002年被聘为中国地球物理学会天灾预测专业委员会顾问、2004年又被聘为中国灾害防御协会灾害史研究专业委员会顾问,现为义务扶持中国被压制的科学新技术发明者的社会活动家和科技先锋思想探索家。 </P>
<P style="TEXT-INDENT: 2em">熟悉陈一文的科技界人士说，陈一文先生近二十年来致力于地震预报研究，发表多篇关于中国科技创新发展、能源与环境、大气污染、强子力学等问题的重要论文，在海内外产生积极反响，特别是其2004年以来多次被权威报刊文库转载的《中国科学技术、经济和社会的高速健康发展呼唤向传统科学技术基本理论提出挑战的科技创新成果》、《中国必须走世界任何国家从未走过的新型能源环境发展道路！》等论文的核心观点，深受科技界关注。 </P>
<P style="TEXT-INDENT: 2em">民间业余地震预报研究者孙威被压制 </P>
<P style="TEXT-INDENT: 2em">陈一文指出，民间业余地震研究专家孙威，数次准确预测地震，遭专业的人士和机构压制。 </P>
<P style="TEXT-INDENT: 2em">1、向地震部门预报四川的松潘—平武7.2级地震被压制。1976年8月16日22点06分，在四川的松潘——平武地区发生了7.2级地震。孙威在在8月14日就断定两三天之内会发生7级左右的地震，用电话向包头市地震办和包钢地震办预报了，结果未被采纳。 </P>
<P style="TEXT-INDENT: 2em">2、向地震部门预报宁夏的巴音木仁地区6.2级地震被压制。1976年的9月22日8时，孙威和观测点同事一起乘火车从包头赶到呼和浩特市向内蒙自治区地震办汪丹主任预报： 1976年的9月23日，包头东部偏南200-500公里范围内，可能发生5.5-6.0级地震，震中列度约为8度。此预报从1976年的9月3日就向包头有关部门预报了，但一直不被采纳。结果，1976年的9月23日04时07分3.8秒，在宁夏的巴音木仁地区，真的发生了6.2级地震，震中列度约为8 度。 </P>
<P style="TEXT-INDENT: 2em">3、在地震局会议上预报天津宁河发生6.9级地震被压制。1976年10月21日，孙威在赴京向国家地震局预报新震情报受阻后，给国务院写了一封预报地震的信：党中央、国务院、华国锋主席，从我们包头钢铁设计院地震观测点得到的观测资料表明，在11月上中旬，华北地区还有可能发生破坏性强震，望能予以重视。六天后的10月27日，孙威又在冶金部科技大会上代表和在京直属单位地震观测点负责人的汇报会上，准确预报：在11月7日到 17日的10天内，中国可能发生两次7级左右的地震，一次可能在京津唐地震老区，天津钢厂要做好防震准备。 </P>
<P style="TEXT-INDENT: 2em">1976年10月30日，国家地震局刘英勇、卫一清等局级领导在木犀地河边木板棚召开“京津唐地区震情分析会商会”，孙威在会上再次预报上述震情。但是会议结束时，国家地震局分析预报室负责人否定了孙威的再次预报，宣布上报国务院的“会议记要”是：京津唐地区今冬明春没有大于6级地震，京东南天津、宝坻一带没有大于5级地震。然而事实恰恰相反：1976年11月7日02点04分，四川盐源泉西北川滇藏交界一带发生了6.9级地震；11月15日21点53分，天津宁河发生6.9级地震，天津市第二毛纺厂正在交接班的工人全部遇难！老百姓气愤地喊着，明明知道有地震还对老百姓保密，一气之下砸了天津市地震局的牌子，还把砸坏的牌子倒挂在原地示众。 </P>
<P style="TEXT-INDENT: 2em">更可愤的是，一如唐山大地震后，国家地震局没有在任何文字材料上留下有多人曾预报过这次地震的痕迹，此次，国家地震局再次向上级和公众隐藏了许多地震预测实践研究者曾准确预报过这次地震的资料。 </P>
<P style="TEXT-INDENT: 2em">据陈一文了解，地震局某些漏报地震致灾后，或者地震系统内部坚持“地震当代能够预测”的地震预测专家或民间地震预测专家提出了正确的预测而且被发生的地震所证实后，地震局至少数次向公众隐瞒真实的情况，目的是使国家地震局“地震当代无法预测”的谬论能够维持下去。 </P>
<P style="TEXT-INDENT: 2em">4、国家地震局曾肯定孙威研制发明的地震前兆监测仪器的先进性，后却因私利而拒绝推广应用。1977年2月16日，国家地震局下达005号文件称∶“今年一月我局在山东省济宁市召开土地电、土地应力测报地震经验交流会，在这次会上包钢设计院地震组介绍了地应力测报地震的经验，引起了大家的注意。会议建议建议在重点地震监视区扩大试验，引起了大家的注意。为此组建试验小组，并邀你单位孙威同志参加此项工作……。” </P>
<P style="TEXT-INDENT: 2em">1977年3月28日，国家地震局下达052号文件进一步称∶“今年一月我局在山东省济宁市召开土地电、土地应力测报地震经验交流会。会议认为包钢设计院研制的简易地应力仪通过前阶段实践有预报大震临震的苗头，有必要选择一些重点地区〔京津唐渤张、苏鲁皖、冀蒙晋交界地区〕进行观测试验。……试验费用……，由局群测群防经费中开支。”并明确规定，筹建29个试验点，以国家地震局文件的形式，正式立项。 </P>
<P style="TEXT-INDENT: 2em">在书稿中，孙威强调指出∶“这是对我发明的‘包头应力’的肯定，是对我们1976年多次成功预报地震的肯定。” </P>
<P style="TEXT-INDENT: 2em">然而，不久，国家地震局在人事变动后，突然将周恩来主持制定的“群测群防”地震防范方针视为“文革遗产”，内幕却因一些主流权威认为鼓励 “群测群防”会给漏报震情的国家地震局带来问责之灾甚至有致命威胁，于是制造由头将多年辛辛苦苦建立的全国地震群测点全部砍杀和“清理”，致使被实践证明确实“有预报大震临震的苗头”的孙威地震预测仪器“英雄无用武之地”。而因包头钢铁设计院地震观测点属于“群测点”被砍掉，海内外尊重的中国最杰出的民间地震预测专家孙威“下岗”待业，失去地震前兆监测试验点17年。直到1995年，辽宁省地震局两位尊重孙威的地震预测专家升任有关职务，有权请孙威到辽宁合作继续“孙氏地震预测法”试验，“孙氏地震预测法”才重获为民为国分忧的机遇。后来孙威得以在北京电业中学再建群测点，中国科学院物理研究所又聘请孙威作为“客座教授”与长期合作共同实验研究探索孙威仪器神奇性能的物理机制。 </P>
<P style="TEXT-INDENT: 2em">孙威还将“群测点”建到美国，在加州建了多个地震前兆监测点。 </P>
<P style="TEXT-INDENT: 2em">近年来新的科学实践证明，孙威的仪器能够在不同大陆〔亚洲与美洲〕、不同地质条件下的不同地区不断重复对多次新的地震再次抓住他的仪器1975-1978年期间已经多次抓住过的“确定性地震前兆”〔即“地震不可预测”专家们承认他们始终未能抓住的可以用来预测地震的地震前兆〕：如1999年11月29日12时10分辽宁省岫岩5.6级地震； 2000年1月12日7时辽宁省岫岩（偏岭）5.1级地震；2003年5月28日19时09分21.6秒美国5.0级地震；2003年8月16日18时 56分43.2秒内蒙古巴林5.9级地震；2004年3月24日09时53分45.0秒内蒙古东乌珠穆沁旗5.9级地震；2004年12月26日08时 58分55.2秒印尼苏门答腊西北近海6.7级地震等。 </P>
<P style="TEXT-INDENT: 2em">三十年来，国家地震局一直对国内坚持“当代能够实现地震预测”的所有地震预测实践研究者进行排斥与压制。陈一文先生举出20多个采用不同仪器、技术、方法实践检验证明成就卓着的非主流地震预测专家。他们中的代表队人物张铁铮、沈宗丕、李均之教授、郑联达教授、吕大炯研究员〔旅美华人〕、寿仲浩〔旅美中国人〕、韩延本研究员、任振球研究员、孙威客座教授、王文祥研究员、杨武洋博士研究生、徐秀登教授、陶守正教授、宋松、刘承昌、李阶法、高发金、郭宝昌，王斌、马未宇等。不仅如此，国家地震局系统内所有坚持“当代能够实现地震预测”具有创新精神的专家也都一再受到打击与冷遇。地震局系统坚持“当代能够实现地震预测”的代表人物包括：郭增建教授、汪成民教授、耿庆国教授、黄相宁副研究员、徐道一研究员、徐好民研究员、张网厚研究员、强祖基教授、曾小苹研究员、钱复业研究员、赵玉林研究员等。 </P>
<P style="TEXT-INDENT: 2em">为何孙威等许多民间业余地震预测一再胜过了国家地震局专业地震预测？ </P>
<P style="TEXT-INDENT: 2em">陈一文认为，从1966年邢台地震中总结出了“小震闹，大震到”经验对震前有前震的许多地震的预测来讲是成功的经验。但是，辽宁省地震局以此成功地预报了 1975年2月14日辽宁海城至营口7.3级地震后，国家地震局某些权威人士误认为它是预测一切地震的经典模式。但地震的发生模式是多元化的，1976年唐山大地震前以及1978年再次发生的海城地震前就没有前震。1976年唐山地震前，虽然唐山地区许多群测点利用自己研制开发的“土仪器”监测记录到清楚的地震前兆、其它地方张铁铮、孙威等不少民间地震预测实践研究者根据自己抓住的地震前兆分析也报告自己的预测意见，皆因为不符合“小震闹，大震到”模式，也不符合国家地震局地震分析预报负责人梅世荣等人当时坚持认为华北不再有强震的判断以及因而受到否定。唐山大地震悲剧发生之后，国家地震局梅世荣等权威一方面上骗中央，谎称唐山大地震前毫无前兆，因而无法预测，拒不检查自己背离“预防为主、专群结合、土洋结合、群测群防”地震工作方针的严重错误所造成的不可原谅的后果，几十年来却一再搬出“地震不可预测是近几代人也无法克服的世界性难题”陈词，蒙哄公众。 </P>
<P style="TEXT-INDENT: 2em">其实，1976-1978年期间，孙威等民间业余地震专家的预测一再胜过国家地震局专业权威的地震预测，首先是因为他们研究开发的“土仪器”优于国家地震局专业队伍的“洋仪器”：“洋仪器”在1975年海城地震前、在1976年唐山地震前、在1978年再次海城地震前未能够监测到可以作为地震预测可靠依据的地震前兆信号，因而声称“没有前兆”，而孙威等许多群测点开发的高灵敏度仪器却能够监测记录到专业“洋仪器”根本监测不到的确定性的地震前兆，并且非常清楚，可作为地震预测的可靠依据。 </P>
<P style="TEXT-INDENT: 2em">此外，孙威等民间业余地震专家的监测方法先进——国家地震局专业地震预测当时对许多地球物理信号采取的是“一天定时记录几个数据”的时点观察法，而孙威等某些群测点的监测记录方法更为先进——采用每天24小时不间断连续记录。远远胜过专业“洋仪器”的中国特色自主创新“土仪器”，以及不会遗漏任何地震前兆信息的新方法，缘于孙威等敢于怀疑和挑战传统地震成因理论——现行的、传统的构造地震理论，是以板块学说为基础，以观测断裂带活动为目标，认为断裂活动是地震的成因；方法是以监测地震活动性为重点，用前震序列及统计规律“以震报震”（小震闹，大震到）；指导思想是长期观测地形变，认为地下能量需要很长时间的聚积，应力需要很长时间的积累，使地壳发生形变直到被压坏，能量突然释放。有了这种片面的指导思想，就会认为一天只要定时记录几个数据就足够了，用不着连续可视的自动记录。殊不知这种长时间守株待兔的办法，丢掉了对地震预测非常重要的许多前兆信息。 </P>
<P style="TEXT-INDENT: 2em">近十多年来，国家地震局尽管把卫星遥感、数字化遥测台网……等最先进的常规技术都用上，还是事倍功半，因为他们沿用的地震孕育触发基本理论存在着严重的片面性、局限性和错误……。而且，采用更先进的数字化时，如果方法不得当，就会像国家地震局已经造成的恶果那样，投资了数千万元的数字化设备，某些重要的地震前兆信息却已经严重失真，成为“垃圾信息”。国家地震局如果继续迷信这些错误理论或过时观念，即使再多引进现代化技术设备，也只会南辕北辙，事与愿违。美国、日本、俄罗斯等地震监测先进的国家，半个世纪的研究结果证明了这一点。 </P>
<P style="TEXT-INDENT: 2em">孙威等民间业余地震预测专家采用的地震前兆监测仪器，大多是根据自己探索的新地震预测理论——追踪前兆信息，循序渐进地逼近“龙头”——自行新研制的，而国家地震局专业地震预测权威们则采用的是进口的或者仿制的传统地震活动监测仪器。理论的保守，方法的因循守旧，形式虽洋但是实际上相对落后的仪器，国家地震局专业地震学权威们一再败阵于孙威等民间业余地震预测专家。 </P>
<P style="TEXT-INDENT: 2em">从1976年到2008年，整整三十二年过去了，孙威等民间业余地震预测专家继续遭到国家地震局专业地震预测权威们的排斥与压制的状态，竟然毫无改善！当年的壮年小伙孙威而今已成为白发苍苍的古稀老人！孙威的《为唐山的悲剧不再重演》书稿，从2005年开始寻求有胆识的出版社，但至今因国家地震局无形压力而被重重关口压制难以问世！ </P>
<P style="TEXT-INDENT: 2em">掀起一个重新反思唐山大地震的热潮 </P>
<P style="TEXT-INDENT: 2em">鉴于国家地震局今日对公众监督的打压，已从早期的只压制不同意见者扩大到所有支持创新地震预测理论和实践的网络媒体，鉴于近期新地震不断出现，不断漏报，“汶川5、12大地震”后国家地震局仍然拒绝反思，陈一文对国家地震局的严厉批评和对建立科学民主的中国地震预测监督和问责机制的深切呼唤，更显得切中时弊，极其可贵，得到了国内外众多地震预测实践研究者的支持与尊敬。据悉，已经有人认真考虑，要依法状告国家地震局，提出不作为渎职行政诉讼，追究其长期压制地震局系统内以及民间业余地震专家、逃避公众合法监督的法律责任。 </P>
<P style="TEXT-INDENT: 2em">对于陈一文的工作，唐山大地震悲剧的研究者、知名作家张庆洲先生（着有畅销书《唐山警示录——七、二八大地震漏报始末》）高度评价道：陈一文对中国地震预测实践研究者跟踪调查研究与社会活动工作的意义不亚于中国地震预测实践研究者群体的地震预测研究工作本身！ </P>
<P style="TEXT-INDENT: 2em">可以说，只有在科学民主的中国地震预测监督和问责机制建立健全之日，“汶川5、12大地震”悲剧才可能终结。唐山大地震的真正悲剧在于三十年拒绝反思地震预报中的思想专制——2006年纪念唐山大地震三十周年时，只知歌颂重建唐山的丰功伟绩，而毫不反思追究当年对科学预报的残酷压制——如果“汶川5、12大地震”仍然坚持唐山大地震预报中的思想专制，那么中国人民只有永远在唐山大地震悲剧之中彻底控制地震之灾之时。 </P>
<P style="TEXT-INDENT: 2em">能否通过“汶川5、12大地震”的惊醒，迅速掀起一个重新反思唐山大地震的热潮，将地震预测中的专制者一并追究责任，由此追究“汶川5、12大地震”的压制科学预报的专制者？如是 ，中国人民可能会少受一点天灾人祸！（2008年 5 月 18日于旅途）</P>
<P style="TEXT-INDENT: 2em"></P></div>]]></description>
	    <author><![CDATA[mjliao]]></author>
	    <comments>http://mjliao.blog.163.com/blog/static/37535193200842975116261</comments>
    <slash:comments>0</slash:comments>
    <guid isPermaLink="true">http://mjliao.blog.163.com/blog/static/37535193200842975116261</guid>
    <pubDate>Thu, 29 May 2008 19:51:16 +0800</pubDate>
    <dcterms:modified>2008-05-30T11:43:02+08:00</dcterms:modified>
  </item>    
  <item>
  	<title><![CDATA[下辈子不当农民！]]></title>	
    <link>http://mjliao.blog.163.com/blog/static/3753519320084272266107</link>
    <description><![CDATA[<div><DIV>
<DIV>
<DIV>
<DIV>
<P><U><FONT color=#800080>&nbsp;&nbsp;&nbsp; 现在民不聊生了，农民做点事情好难呀开个农用车，油价上涨，没补贴！养路费，没货拉，照样交，考个驾证，要你考N次，上钱多先过，办证这个600，那个800，东西一拖再拖。运费超低，还要交罚款，这个不开票（罚单）500，开罚单1000.要命，这一个月又白干了，办个证又不知情，怎么办，到哪办，还要从偏僻的地方跑100里，到灯红酒绿的市里，当天不一定能办完，改天再来，劳命伤财<BR>&nbsp;&nbsp;&nbsp; 为民服务的公仆呀，你们的规章制度的制定---收费的制定，罚款的制定，有没有深入实际调查，老百姓不吃不喝整天在为你门服务，能否给个笑脸，说话能否说话和气点虽然我没制服穿，穿的破烂，灰头灰脑，没时间也没钱打扮，可是我与你们还是有一层玻璃和墙之隔，没有风也不挥发也不会污染你<BR>&nbsp;&nbsp;&nbsp; 兴百姓苦，亡百姓苦！就是命苦，但愿下辈子不当农民！</FONT></U></P></DIV></DIV></DIV></DIV><A href="http://comment2.news.sohu.com/viewcomments.action?id=257104514" target=_blank></A>
<P>----------------------------<BR>一键转贴，快速捕捉生活精彩，赢每周好礼！<A href="http://blog.163.com/activities/hunter/hunter.do?080526jclr46" target=_blank>查看活动首页&gt;&gt;</A></P></div>]]></description>
	    <author><![CDATA[mjliao]]></author>
	    <comments>http://mjliao.blog.163.com/blog/static/3753519320084272266107</comments>
    <slash:comments>0</slash:comments>
    <guid isPermaLink="true">http://mjliao.blog.163.com/blog/static/3753519320084272266107</guid>
    <pubDate>Tue, 27 May 2008 14:26:06 +0800</pubDate>
    <dcterms:modified>2008-05-29T19:48:58+08:00</dcterms:modified>
  </item>    
  <item>
  	<title><![CDATA[开始游戏编程以及在游戏中运用AI]]></title>	
    <link>http://mjliao.blog.163.com/blog/static/37535193200841143626760</link>
    <description><![CDATA[<div><P style="TEXT-INDENT: 2em"><I></I>&nbsp; </P>
<P style="TEXT-INDENT: 2em">相信很多人伴随着游戏长大的。我们曾经好奇游戏中人物和场景的表现。可是我们对游戏编程知识了解很少。也有过一段时间在学习编程语言，但对于游戏开发只是进展缓慢。 </P>
<P style="TEXT-INDENT: 2em">要学会游戏编程，首先需要具有一定的计算机编程知识，熟悉几种编程语言以及程序的开发思想。进行游戏开发前，可以熟悉和读懂一些游戏源码，然后再尝试学习人工智能方面的知识，要知道，没有AI的游戏是乏味的。 要想开发游戏先得掌握一门语言，本文给读者推荐一个开发语言：Python。</P>
<P style="TEXT-INDENT: 2em">1首先得学习python语言，极力成为一个代码编写者，经常应用于学习、工作或者娱乐；</P>
<P style="TEXT-INDENT: 2em">2下载pygame库，并仔细研究这些例子；</P>
<P style="TEXT-INDENT: 2em">3试着编写像steering行为的简单AI例子;</P>
<P style="TEXT-INDENT: 2em">4利用现成的库实验AI技术；</P>
<P style="TEXT-INDENT: 2em">Python语言很直接，很容易理解，有丰富的列表等数据结构。虽然没有c++语言那么历史悠久。对于初学者是一个很好的选择。python语言的应用也是工业级的，很多动画和电影是基于它的。</P>
<P style="TEXT-INDENT: 2em">&nbsp;</P>
<P style="TEXT-INDENT: 2em">&nbsp;</P></div>]]></description>
	    <author><![CDATA[mjliao]]></author>
	    <comments>http://mjliao.blog.163.com/blog/static/37535193200841143626760</comments>
    <slash:comments>0</slash:comments>
    <guid isPermaLink="true">http://mjliao.blog.163.com/blog/static/37535193200841143626760</guid>
    <pubDate>Sun, 11 May 2008 16:36:26 +0800</pubDate>
    <dcterms:modified>2008-05-11T20:20:52+08:00</dcterms:modified>
  </item>    
  <item>
  	<title><![CDATA[“读书无用论”再度流行]]></title>	
    <link>http://mjliao.blog.163.com/blog/static/375351932008214101759432</link>
    <description><![CDATA[<div><P><STRONG></STRONG>&nbsp;</P>
<P><STRONG>　　[新观察] 代表委员透析新一轮“脑体倒挂”</STRONG></P>
<P>　　本报记者 李斌</P>
<P>　　有人以为，“脑体倒挂”早已成为历史名词，但在全国两会上，一位政协委员又把它写进了提案中，郑重建议“防止新一轮‘脑体倒挂’”。 
<TABLE cellSpacing=0 cellPadding=0 align=left border=0>
<TBODY>
<TR>
<TD vAlign=top>
<TABLE cellSpacing=4 cellPadding=0 width=350 align=left border=0>
<TBODY>
<TR>
<TD>
<DIV></DIV></TD></TR></TBODY></TABLE></TD></TR>
<TR>
<TD></TD></TR></TBODY></TABLE></P>
<P>　　提案的作者是全国政协委员、辽宁省糖尿病治疗中心主任冯世良，他用两个事例来向记者说明，脑体倒挂的现象已非常严重。不久前，他无法拒绝一位熟人的情面，接收了两位某中医药大学的硕士毕业生。他们没有从医资格，不能给病人把脉问诊，也没有能力参与科研，每个月只能从中心领取400元的生活补助费。</P>
<P>　　还有一对来自贫困山区的表兄弟。表弟是一位装修工，每年干8个月左右的活，平均每月可以拿到2500元左右。表哥大学毕业快一年了，还没有找到工作，并多次拒绝了表弟的好意，执意不肯与他“一起打工，做学徒”。农民工表弟后来深有感触地对冯世良说：“我真谢谢我自己，没有考上大学。”</P>
<P>　　最近两年，常有媒体报道，大学毕业生的工资还不如农民工。2006年年初，劳动和社会保障部对25个省（区、市）的5300多名外出务工人员做了一项调查，发现他们对当年外出务工的月工资平均预期已达到1100多元。</P>
<P>　　而众多大小规模的调查数据显示，应届大学毕业生对月薪的预期连年下跌，2006年已降至1000元左右。去年，北京大学教育经济研究所和高等教育研究所对2007年高校毕业生就业状况进行了调查统计，结果令人无法乐观：50％的毕业生月起薪在1000元~2000元之间。</P>
<P>　　记者就此和很多人交流过，大家有一个共识：大学毕业生似乎越来越不值钱。一家中央媒体的记者是从北京大学毕业的硕士，今年他回湖南老家过春节，明显地感觉到了村民对他的冷淡。“以前，一个吃公家饭的人回到村里，大家会对你很热情很尊敬。”他说，“但现在，没人把你当回事了。在村民看来，你还没有他们有钱。”这位记者月收入在4000元左右，而村民中有身家千万的包工头，有月入数千元的小生意人，再普通不过的一个建筑工人，日工资标准已经超过80元。</P>
<P>　　在20世纪80年代到90年代初的大约10年里,“脑体倒挂”是一个热门的公众话题。当时，从事脑力劳动的知识分子的收入远远低于体力劳动者。有一句至今还有很多人熟记的顺口溜：“搞原子弹的不如卖茶叶蛋的，拿手术刀的不如拿剃头刀的。”“读书无用论”也随之流行。</P>
<P>　　今天，“读书无用论”再度流行。全国人大代表、湘潭大学校长罗和安说，这种声音主要来自城乡的贫困家庭，他们认为，“不让孩子读书脱不了贫，让孩子上大学可能穷得更快”。</P>
<P>　　在这位大学校长看来，如果说存在“脑体倒挂”现象的话，应该是指很多大学毕业生接受高等教育的成本与其得到的回报差异很大，前者过高，后者过低，“在一定时期内，很难有能力收回教育成本”，对那些举全家之力供孩子上大学的贫困家庭来说，这一点尤其明显。</P>
<P>　　当今中国的知识精英大多确实过上了富有的生活，罗和安代表说，这与上个世纪80至90年代初期的情况很不一样。“那时的大学是精英教育，受教育程度越高的人越有可能进入科研院所和政府机关。”罗校长说，而这些单位的职工收入要低于企业工人和生意人，导致“脑体倒挂”。而现在值得高度关注的，是那些刚毕业的大学生。</P>
<P>　　冯世良委员把新一轮“脑体倒挂”形成的原因之一归咎于一些高校，即“一味地增设各种热门专业或学生就业后能拥有相对轻松的工作环境的专业，而很少负为国家和民族的未来进行长远规划的责任”。</P>
<P>　　罗和安代表认为，现在很多高校学科和专业的设置已经与社会需求脱节。一些热门专业，如工商管理、法律和新闻，市场需要不了那么多，但很多高校却争相开设，原因在于“其投入成本低，只要抓几个老师就行”，还可以高收费，而一些理工科专业，需要仪器设备、实验室，投入成本会比前者高出30％~50％。</P>
<P>　　罗和安指出：目前，大学向市场推出的产品——学生，其质量令人担忧。“在大学最重要的是要锻炼提高学习能力和创新精神，出去后不管干什么，都能很快适应。”罗校长说，实际情况与理想状态还有很大的差距。</P>
<P>　　中国社科院人口与劳动经济研究所副所长张车伟曾对中国青年报记者表示，中国高等教育出现了结构性问题——不同层次的大学定位一样，都在争夺同样的位置。他认为，一些高校必须转向培养技能型、生产型人才的领域，才会有竞争力。</P>
<P>　　“劳动力市场所释放的这个信号清楚地表明，市场更需要财富的直接创造者。”张副所长说，在劳动力市场上，大学生越来越多，而熟练技工却越来越供不应求。他认为，市场会慢慢引导一些高校走上适合自己发展的道路，但在此之前的高校毕业生会付出代价。本报北京3月13日电</P><BR><BR><BR>本文出自:&nbsp;&nbsp;<A href="http://news.sohu.com/20080314/n255698441.shtml"></A></div>]]></description>
	    <author><![CDATA[mjliao]]></author>
	    <comments>http://mjliao.blog.163.com/blog/static/375351932008214101759432</comments>
    <slash:comments>0</slash:comments>
    <guid isPermaLink="true">http://mjliao.blog.163.com/blog/static/375351932008214101759432</guid>
    <pubDate>Fri, 14 Mar 2008 10:17:59 +0800</pubDate>
    <dcterms:modified>2008-03-14T10:17:59+08:00</dcterms:modified>
  </item>    
  <item>
  	<title><![CDATA[如果让我重做一次研究生]]></title>	
    <link>http://mjliao.blog.163.com/blog/static/375351932007111671914375</link>
    <description><![CDATA[<div><P><FONT size=3>(转载)</FONT></P>
<P><FONT size=3>王汎森&nbsp;&nbsp; 院士 / 中央研究院历史语言研究所</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 这个题目我非常喜欢，因为这个题目，对大家多少都有实际的帮助。如果下次我必</FONT></P>
<P><FONT size=3>须再登台演讲，我觉得这个题目还可以再发挥一两次。我是台大历史研究所毕业的，所</FONT></P>
<P><FONT size=3>以我的硕士是在台大历史研究所，我的博士是在美国普林斯顿大学取得的。我想在座的</FONT></P>
<P><FONT size=3>各位有硕士、有博士，因此我以这两个阶段为主，把我的经验呈现给各位。</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 我从来不认为我是位有成就的学者，我也必须跟各位坦白，我为了要来做这场演讲</FONT></P>
<P><FONT size=3>，在所里碰到刚从美国读完博士回来的同事，因为他们刚离开博士生的阶段，比较有一</FONT></P>
<P><FONT size=3>些自己较独特的想法，我就问他：「如果你讲这个问题，准备要贡献什么？」结合了他</FONT></P>
<P><FONT size=3>们的意见，共同酝酿了今天的演讲内容，因此这里面不全是我一个人的观点。虽然我的</FONT></P>
<P><FONT size=3>硕士论文和博士论文都出版了，但不表示我就是一个成功的研究生，因为我也总还有其</FONT></P>
<P><FONT size=3>它方面仍是懵懵懂懂。我的硕士论文是二十年前时报出版公司出版的，我的博士论文是</FONT></P>
<P><FONT size=3>英国剑桥大学出版的。你说有特别好吗？我不敢乱说。我今天只是综合一些经验，提供</FONT></P>
<P><FONT size=3>大家参考。</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 一、研究生与大学生的区别</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 首先跟大家说明一下研究生和大学生的区别。大学生基本上是来接受学问、接受知</FONT></P>
<P><FONT size=3>识的，然而不管是对于硕士时期或是博士时期的研究而言，都应该准备要开始制造新的</FONT></P>
<P><FONT size=3>知识，我们在美国得到博士学位时都会领到看不懂的毕业证书，在一个偶然的机会下，</FONT></P>
<P><FONT size=3>我问了一位懂拉丁文的人，上面的内容为何？他告诉我：「里头写的是恭喜你对人类的</FONT></P>
<P><FONT size=3>知识有所创新，因此授予你这个学位。」在中国原本并没有博硕士的学历，但是在西方</FONT></P>
<P><FONT size=3>他们原来的用意是，恭贺你已经对人类普遍的知识有所创新，这个创新或大或小，都是</FONT></P>
<P><FONT size=3>对于普遍的知识有所贡献。这个创新不会因为你做本土与否而有所不同，所以第一个我</FONT></P>
<P><FONT size=3>们必须要很用心、很深刻的思考，大学生和研究生是不同的。</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; （一）选择自己的问题取向，学会创新</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 你一旦是研究生，你就已经进入另一个阶段，不只是要完全乐在其中，更要从而接</FONT></P>
<P><FONT size=3>受各种有趣的知识，进入制造知识的阶段，也就是说你的论文应该有所创新。由接受知</FONT></P>
<P><FONT size=3>识到创造知识，是身为一个研究生最大的特色，不仅如此，还要体认自己不再是个容器</FONT></P>
<P><FONT size=3>，等着老师把某些东西倒在茶杯里，而是要开始逐步发展和开发自己。做为研究生不再</FONT></P>
<P><FONT size=3>是对于各种新奇的课照单全收，而是要重视问题取向的安排，就是在硕士或博士的阶段</FONT></P>
<P><FONT size=3>里面，所有的精力、所有修课以及读的书里面都应该要有一个关注的焦点，而不能像大</FONT></P>
<P><FONT size=3>学那般漫无目标。大学生时代是因为你要尽量开创自己接受任何东西，但是到了硕士生</FONT></P>
<P><FONT size=3>和博士生，有一个最终的目的，就是要完成论文，那篇论文是你个人所有武功的总集合</FONT></P>
<P><FONT size=3>，所以这时候必须要有个问题取向的学习。</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; （二）尝试跨领域研究，主动学习</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 提出一个重要的问题，跨越一个重要的领域，将决定你未来的成败。我也在台大和</FONT></P>
<P><FONT size=3>清华教了十几年的课，我常常跟学生讲，选对一个领域和选对一个问题是成败的关键，</FONT></P>
<P><FONT size=3>而你自己本身必须是带着问题来探究无限的学问世界，因为你不再像大学时代一样泛滥</FONT></P>
<P><FONT size=3>无所归。所以这段时间内，必须选定一个有兴趣与关注的主题为出发点，来探究这些知</FONT></P>
<P><FONT size=3>识，产生有机的循环。由于你是自发性的对这个问题产生好奇和兴趣，所以你的态度和</FONT></P>
<P><FONT size=3>大学部的学生是截然不同的，你慢慢从被动的接受者变成是一个主动的探索者，并学会</FONT></P>
<P><FONT size=3>悠游在这学术的领域。</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 我举一个例子，我们的中央研究院院长李远哲先生，得了诺贝尔奖。他曾经在中研</FONT></P>
<P><FONT size=3>院的周报写过几篇文章，在他的言论集里面，或许各位也可以看到，他反复提到他的故</FONT></P>
<P><FONT size=3>事。他是因为读了一个叫做马亨教授的教科书而去美国柏克莱大学念书，去了以后才发</FONT></P>
<P><FONT size=3>现，这个老师只给他一张支票，跟他说你要花钱你尽量用，但是从来不教他任何东西。</FONT></P>
<P><FONT size=3>可是隔壁那个教授，老师教很多，而且每天学生都是跟着老师学习。他有一次就跟那个</FONT></P>
<P><FONT size=3>老师抱怨：「那你为什么不教我点东西呢？」那个老师就说：「如果我知道结果，那我</FONT></P>
<P><FONT size=3>要你来这边念书做什么？我就是因为不知道，所以要我们共同探索一个问题、一个未知</FONT></P>
<P><FONT size=3>的领域。」他说其实这两种教法都有用处，但是他自己从这个什么都不教他，永远碰到</FONT></P>
<P><FONT size=3>他只问他「有没有什么新发现」的老师身上，得到很大的成长。所以这两方面都各自蕴</FONT></P>
<P><FONT size=3>含深层的道理，没有所谓的好坏，但是最好的方式就是将这两个方式结合起来。我为什</FONT></P>
<P><FONT size=3>么讲这个故事呢？就是强调在这个阶段，学习是一种「 self-help 」，并且是在老师的</FONT></P>
<P><FONT size=3>引导下学习「 self-help 」，而不能再像大学时代般，都是纯粹用听的，这个阶段的学</FONT></P>
<P><FONT size=3>习要基于对研究问题的好奇和兴趣，要带着一颗热忱的心来探索这个领域。</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 然而研究生另外一个重要的阶段就是 Learn how to learn ，不只是学习而已，而</FONT></P>
<P><FONT size=3>是学习如何学习，不再是要去买一件很漂亮的衣服，而是要学习拿起那一根针，学会绣</FONT></P>
<P><FONT size=3>出一件漂亮的衣服，慢慢学习把目标放在一个标准上，而这一个标准就是你将来要完成</FONT></P>
<P><FONT size=3>硕士或博士论文。如果你到西方一流的大学去读书，你会觉得我这一篇论文可能要和全</FONT></P>
<P><FONT size=3>世界做同一件问题的人相比较。我想即使在台湾也应该要有这样的心情，你的标准不能</FONT></P>
<P><FONT size=3>单单只是放在旁边几个人而已，而应该是要放在领域的普遍人里面。你这篇文章要有新</FONT></P>
<P><FONT size=3>的东西，才算达到的标准，也才符合到我们刚刚讲到那张拉丁文的博士证书上面所讲的</FONT></P>
<P><FONT size=3>，有所贡献与创新。</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 二、一个老师怎么训练研究生</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 第二个，身为老师你要怎么训练研究生。我认为人文科学和社会科学的训练，哪怕</FONT></P>
<P><FONT size=3>是自然科学的训练，到研究生阶段应该更像师徒制，所以来自个人和老师、个人和同侪</FONT></P>
<P><FONT size=3>间密切的互动和学习是非常重要的，跟大学部坐在那边单纯听课，听完就走人是不一样</FONT></P>
<P><FONT size=3>的，相较之下你的生活应该要和你所追求的知识与解答相结合，并且你往后的生活应该</FONT></P>
<P><FONT size=3>或多或少都和这个探索有相关。</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; （一）善用与老师的伙伴关系，不断 Research</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 我常说英文 research 这个字非常有意义， search 是寻找，而 research 是再寻</FONT></P>
<P><FONT size=3>找，所以每个人都要 research ，不断的一遍一遍再寻找，并进而使你的生活和学习成</FONT></P>
<P><FONT size=3>为一体。中国近代兵学大师蒋百里在他的兵学书中曾说：「生活条件要跟战斗条件一致</FONT></P>
<P><FONT size=3>，近代欧洲凡生活与战斗条件一致者强，凡生活与战斗条件不一致者弱。」我就是藉由</FONT></P>
<P><FONT size=3>这个来说明研究生的生活，你的生活条件与你的战斗条件要一致，你的生活是跟着老师</FONT></P>
<P><FONT size=3>与同学共同成长的，当中你所听到的每一句话，都可能带给你无限的启发。</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 回想当时我在美国念书的研究生生活，只要随便在楼梯口碰到任何一个人，他都有</FONT></P>
<P><FONT size=3>办法帮忙解答你语言上的困难，不管是英文、拉丁文、德文、希腊文 …… 等。所以能</FONT></P>
<P><FONT size=3>帮助解决问题的不单只是你的老师，还包括所有同学以及学习团体。你的学习是跟生活</FONT></P>
<P><FONT size=3>合在一起的。当我看到有学生呈现被动或是懈怠的时候，我就会用***的「革命不是</FONT></P>
<P><FONT size=3>请客吃饭！」来跟他讲：「作研究生不是请客吃饭。」</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; （二）藉由大量阅读和老师提点，进入研究领域</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 怎样进入一个领域最好，我个人觉得只有两条路，其中一条就是让他不停的念书、</FONT></P>
<P><FONT size=3>不停的报告，这是进入一个陌生的领域最快，又最方便的方法，到最后不知不觉学生就</FONT></P>
<P><FONT size=3>会知道这个领域有些什么，我们在不停念书的时候常常可能会沉溺在细节里不能自拔，</FONT></P>
<P><FONT size=3>进而失去全景，导致见树不见林，或是被那几句英文困住，而忘记全局在讲什么。藉由</FONT></P>
<P><FONT size=3>学生的报告，老师可以讲述或是厘清其中的精华内容，经由老师几句提点，就会慢慢打</FONT></P>
<P><FONT size=3>通任督二脉，逐渐发展一种自发学习的能力，同时也知道碰到问题可以看哪些东西。就</FONT></P>
<P><FONT size=3>像是我在美国念书的时候，我修过一些我完全没有背景知识的国家的历史，所以我就不</FONT></P>
<P><FONT size=3>停的念书、不停的逼着自己吸收，而老师也只是不停的开书目，运用这样的方式慢慢训</FONT></P>
<P><FONT size=3>练，有一天我不再研究它时，我发现自己仍然有自我生产及蓄发的能力，因为我知道这</FONT></P>
<P><FONT size=3>个学问大概是什么样的轮廓，碰到问题也有能力可以去查询相关的资料。所以努力让自</FONT></P>
<P><FONT size=3>己的学习产生自发的延展性是很重要的。</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; （三）循序渐进地练习论文写作</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 到了硕士或博士最重要的一件事，是完成一篇学位论文，而不管是硕士或博士论文</FONT></P>
<P><FONT size=3>，其规模都远比你从小学以来所受的教育、所要写的东西都还要长得多，虽然我不知道</FONT></P>
<P><FONT size=3>教育方面的论文情况是如何，但是史学的论文都要写二、三十万字，不然就是十几二十</FONT></P>
<P><FONT size=3>万字。写这么大的一个篇幅，如何才能有条不紊、条理清楚，并把整体架构组织得通畅</FONT></P>
<P><FONT size=3>可读？首先，必须要从一千字、五千字、一万字循序渐进的训练，先从少的慢慢写成多</FONT></P>
<P><FONT size=3>的，而且要在很短的时间内训练到可以从一万字写到十万字。这么大规模的论文谁都写</FONT></P>
<P><FONT size=3>得出来，问题是写得好不好，因为这么大规模的写作，有这么许多的脚注，还要注意首</FONT></P>
<P><FONT size=3>尾相映，使论述一体成型，而不是散落一地的铜钱；是一间大礼堂，而不是一间小小分</FONT></P>
<P><FONT size=3>割的阁楼。为了完成一个大的、完整的、有机的架构模型，必须要从小规模的篇幅慢慢</FONT></P>
<P><FONT size=3>练习，这是一个最有效的办法。</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 因为受计算机的影响，我发现很多学生写文章能力都大幅下降。写论文时很重要的</FONT></P>
<P><FONT size=3>一点是，文笔一定要清楚，不要花俏、不必漂亮，「清楚」是最高指导原则，经过慢慢</FONT></P>
<P><FONT size=3>练习会使你的文笔跟思考产生一致的连贯性。我常跟学生讲不必写的花俏，不必展现你</FONT></P>
<P><FONT size=3>散文的才能，因为这是学术论文，所以关键在于要写得非常清楚，如果有好的文笔当然</FONT></P>
<P><FONT size=3>更棒，但那是可遇不可求的，文彩像个人的生命一样，英文叫 style ， style 本身就</FONT></P>
<P><FONT size=3>像个人一样带有一点点天生。因此最重要的还是把内容陈述清楚，从一万字到最后十万</FONT></P>
<P><FONT size=3>字的东西，都要架构井然、论述清楚、文笔清晰。</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 我在念书的时候，有一位欧洲史、英国史的大师 Lawrence Stone ，他目前已经过</FONT></P>
<P><FONT size=3>世了，曾经有一本书访问十位最了不起的史学家，我记得他在访问中说了一句非常吸引</FONT></P>
<P><FONT size=3>人注意的话，他说他英文文笔相当好，所以他一辈子没有被退过稿。因此文笔清楚或是</FONT></P>
<P><FONT size=3>文笔好，对于将来文章可被接受的程度有举足轻重的地位。内容非常重要，有好的表达</FONT></P>
<P><FONT size=3>工具更是具有加分的作用，但是这里不是讲究漂亮的 style ，而是论述清楚。</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 三、研究生如何训练自己</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; （一）尝试接受挑战，勇于克服</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 研究生如何训练自己？就是每天、每周或每个月给自己一个挑战，要每隔一段时间</FONT></P>
<P><FONT size=3>就给自己一个挑战，挑战一个你做不到的东西，你不一定要求自己每次都能顺利克服那</FONT></P>
<P><FONT size=3>个挑战，但是要努力去尝试。我在我求学的生涯中，碰到太多聪明但却一无所成的人，</FONT></P>
<P><FONT size=3>因为他们很容易困在自己的障碍里面，举例来说，我在普林斯顿大学碰到一个很聪明的</FONT></P>
<P><FONT size=3>人，他就是没办法克服他给自己的挑战，他就总是东看西看，虽然我也有这个毛病，可</FONT></P>
<P><FONT size=3>是我会定期给我自己一个挑战，例如：我会告诉自己，在某一个期限内，无论如何一定</FONT></P>
<P><FONT size=3>要把这三行字改掉，或是这个礼拜一定要把这篇草稿写完，虽然我仍然常常写不完，但</FONT></P>
<P><FONT size=3>是有这个挑战跟没这个挑战是不一样的，因为我挑战三次总会完成一次，完成一次就够</FONT></P>
<P><FONT size=3>了，就足以表示克服了自己，如果觉得每一个礼拜的挑战，可行性太低，可以把时间延</FONT></P>
<P><FONT size=3>长为一个月的挑战，去挑战原来的你，不一定能做到的事情。不过也要切记，硕士生是</FONT></P>
<P><FONT size=3>刚开始进入这一个领域的新手，如果一开始问题太小，或是问题大到不能控制，都会造</FONT></P>
<P><FONT size=3>成以后研究的困难。</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; （二）论文的写作是个训练过程，不能苛求完成精典之作</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 各位要记得我以前的老师所说的一句话：「硕士跟博士是一个训练的过程，硕士跟</FONT></P>
<P><FONT size=3>博士不是写经典之作的过程。」我看过很多人，包括我的亲戚朋友们，他之所以没有办</FONT></P>
<P><FONT size=3>法好好的完成硕士论文，或是博士论文，就是因为他把它当成在写经典之作的过程，虽</FONT></P>
<P><FONT size=3>然事实上，很多人一生最好的作品就是硕士论文或博士论文，因为之后的时间很难再有</FONT></P>
<P><FONT size=3>三年或六年的时间，沉浸在一个主题里反复的耕耘，当你做教授的时候，像我今天被行</FONT></P>
<P><FONT size=3>政缠身，你不再有充裕的时间好好探究一个问题，尤其做教授还要指导学生、上课，因</FONT></P>
<P><FONT size=3>此非常的忙碌，所以他一生最集中又精华的时间，当然就是他写博士、或是硕士论文的</FONT></P>
<P><FONT size=3>时候，而那一本成为他一生中最重要的著作也就一点都不奇怪了。</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 不一定要刻意强求，要有这是一个训练过程的信念，应该清楚知道从哪里开始，也</FONT></P>
<P><FONT size=3>要知道从哪里放手，不要无限的追下去。当然我不是否认这个过程的重要性，只是要调</FONT></P>
<P><FONT size=3>整自己的心态，把论文的完成当成一个目标，不要成为是一种的心理障碍或是心理负担</FONT></P>
<P><FONT size=3>。这方面有太多的例子了，我在普林斯顿大学念书的时候，那边旧书摊有一位非常博学</FONT></P>
<P><FONT size=3>多文的旧书店老板，我常常赞叹的对他说：「你为什么不要在大学做教授。」他说：「</FONT></P>
<P><FONT size=3>因为那篇博士论文没有写完。」原因在于他把那个博士论文当成要写一本经典，那当然</FONT></P>
<P><FONT size=3>永远写不完。如果真能写成经典那是最好，就像美丽新境界那部电影的男主角 John Na</FONT></P>
<P><FONT size=3>sh 一样，一生最大的贡献就是博士那二十几页的论文，不过切记不要把那个当作是目标</FONT></P>
<P><FONT size=3>，因为那是自然而然形成的，应该要坚定的告诉自己，所要完成的是一份结构严谨、论</FONT></P>
<P><FONT size=3>述清楚与言之有物的论文，不要一开始就期待它是经典之作。如果你期待它是经典之作</FONT></P>
<P><FONT size=3>，你可能会变成我所看到的那位旧书摊的老板，至于我为什么知道他有那么多学问，是</FONT></P>
<P><FONT size=3>因为那时候我在找一本书，但它并没有在旧书店里面，不过他告诉我：「还有很多本都</FONT></P>
<P><FONT size=3>跟他不相上下。」后来我对那个领域稍稍懂了之后，证明确实如他所建议的那般。一个</FONT></P>
<P><FONT size=3>旧书店的老板精熟每一本书，可是他就是永远无法完成，他梦幻般的学位论文，因为他</FONT></P>
<P><FONT size=3>不知道要在哪里放手，这一切都只成为空谈。</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; （三）论文的正式写作</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 1. 学习有所取舍</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 到了写论文的时候，要能取也要能舍，因为现在信息爆炸，可以看的书太多，所以</FONT></P>
<P><FONT size=3>一定要建构一个属于自己的知识树，首先，要有一棵自己的知识树，才能在那棵树挂相</FONT></P>
<P><FONT size=3>关的东西，但千万不要不断的挂不相关的东西，而且要慢慢的舍掉一些挂不上去的东西</FONT></P>
<P><FONT size=3>，再随着你的问题跟关心的领域，让这棵知识树有主干和枝叶。然而这棵知识树要如何</FONT></P>
<P><FONT size=3>形成？第一步你必须对所关心的领域中，有用的书籍或是数据非常熟悉。</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 2. 形成你的知识树</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 我昨天还请教林毓生院士，他今年已经七十几岁了，我告诉他我今天要来作演讲，</FONT></P>
<P><FONT size=3>就问他：「你如果讲这个题目你要怎么讲？」他说：「只有一点，就是那重要的五、六</FONT></P>
<P><FONT size=3>本书要读好几遍。」因为林毓生先生是海耶克，还有几位近代思想大师在芝加哥大学的</FONT></P>
<P><FONT size=3>学生，他们受的训练中很重要的一部份是精读原典。这句话很有道理，虽然你不可能只</FONT></P>
<P><FONT size=3>读那几本重要的书，但是那五、六本书将逐渐形成你知识树的主干，此后的东西要挂在</FONT></P>
<P><FONT size=3>上面，都可以参照这一个架构，然后把不相干的东西暂放一边。生也有涯，知也无涯，</FONT></P>
<P><FONT size=3>你不可能读遍天下所有的好书，所以要学习取舍，了解自己无法看遍所有有兴趣的书，</FONT></P>
<P><FONT size=3>而且一但看遍所有有兴趣的书，很可能就会落得普林斯顿街上的那位旧书店的老板一般</FONT></P>
<P><FONT size=3>，因为阅读太多不是自己所关心的领域的知识，它对于你来说只是一地的散钱。</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 3. 掌握工具</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 在这个阶段一定要掌握语文与合适的工具。要有一个外语可以非常流畅的阅读，要</FONT></P>
<P><FONT size=3>有另外一个语文至少可以看得懂文章的标题，能学更多当然更好，但是至少要有一个语</FONT></P>
<P><FONT size=3>文，不管是英文、日文、法文 …… 等，一定要有一个语文能够非常流畅的阅读相关书</FONT></P>
<P><FONT size=3>籍，这是起码的前提。一旦这个工具没有了，你的视野就会因此大受限制，因为语文就</FONT></P>
<P><FONT size=3>如同是一扇天窗，没有这个天窗你这房间就封闭住了。为什么你要看得懂标题？因为这</FONT></P>
<P><FONT size=3>样才不会有重要的文章而你不知道，如果你连标题都看不懂，你就不知道如何找人来帮</FONT></P>
<P><FONT size=3>你或是自己查相关的数据。其它的工具，不管是统计或是其它的任何工具，你也一定要</FONT></P>
<P><FONT size=3>多掌握，因为你将来没有时间再把这样的工具学会。</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 4. 突破学科间的界线</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 应该要把跨学科的学习当作是一件很重要的事，但是跨学科涉及到的东西必须要对</FONT></P>
<P><FONT size=3>你这棵知识树有帮助，要学会到别的领域稍微偷打几枪，到别的领域去摄取一些概念，</FONT></P>
<P><FONT size=3>对于本身关心的问题产生另一种不同的启发，可是不要泛滥无所归。为什么要去偷打那</FONT></P>
<P><FONT size=3>几枪？近几十年来，人们发现不管是科学或人文，最有创新的部份是发生在学科交会的</FONT></P>
<P><FONT size=3>地方。为什么会如此？因为我们现在的所有学科大部分都在西方十九世纪形成的，而中</FONT></P>
<P><FONT size=3>国再把它转借过来。十九世纪形成这些知识学科的划分的时候，很多都带有那个时代的</FONT></P>
<P><FONT size=3>思想跟学术背景，比如说，中研院的李院长的专长就是物理化学，他之所以得诺贝尔奖</FONT></P>
<P><FONT size=3>就是他在物理和化学的交界处做工作。像诺贝尔经济奖，这二十年来所颁的奖，如果在</FONT></P>
<P><FONT size=3>传统的经济学奖来看就是旁门走道，古典经济学岂会有这些东西，甚至心理学家也得诺</FONT></P>
<P><FONT size=3>贝尔经济奖，连 John Nash 这位数学家也得诺贝尔经济奖，为什么？因为他们都在学科</FONT></P>
<P><FONT size=3>的交界上，学科跟学科、平台跟平台的交界之处有所突破。在平台本身、在学科原本最</FONT></P>
<P><FONT size=3>核心的地方已经 search 太多次了，因此不一定能有很大的创新，所以为什么跨领域学</FONT></P>
<P><FONT size=3>习是一件很重要的事情。</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 常常一篇硕士论文或博士论文最重要、最关键的，是那一个统摄性的重要概念，而</FONT></P>
<P><FONT size=3>通常你在本学科里面抓不到，是因为你已经泡在这个学科里面太久了，你已经拿着手电</FONT></P>
<P><FONT size=3>筒在这个小仓库里面照来照去照太久了，而忘了还有别的东西可以更好解释你这些材料</FONT></P>
<P><FONT size=3>的现象，不过这些东西可遇而不可求。 John Nash 这一位数学家为什么会得诺贝尔数学</FONT></P>
<P><FONT size=3>奖？为什么他在赛局理论的博士论文，会在数十年之后得诺贝尔经济奖？因为他在大学</FONT></P>
<P><FONT size=3>时代上经济学导论的课，所以他认为数学可以用在经济方面来思考，而这个东西在一开</FONT></P>
<P><FONT size=3>始，他也没有想到会有这么大的用处。他是在数学和经济学的知识交界之处做突破。有</FONT></P>
<P><FONT size=3>时候在经济学这一个部分没有大关系，在数学的这一个部分也没有大关系，不过两个加</FONT></P>
<P><FONT size=3>在一起，火花就会蹦出来。</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 5. 论文题目要有延展性</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 对一个硕士生或博士生来说，如果选错了题目，就是失败，题目选对了，还有百分</FONT></P>
<P><FONT size=3>之七十胜利的机会。这个问题值得研一、博一的学生好好思考。你的第一年其实就是要</FONT></P>
<P><FONT size=3>花在这上面，你要不断的跟老师商量寻找一个有意义、有延展性的问题，而且不要太难</FONT></P>
<P><FONT size=3>。我在国科会当过人文处长，当我离开的时候，每次就有七千件申请案，就有一万四千</FONT></P>
<P><FONT size=3>个袋子，就要送给一万四千个教授审查。我当然不可能看那么多，可是我有个重要的任</FONT></P>
<P><FONT size=3>务，就是要看申诉。有些申诉者认为：「我的研究计划很好，我的著作很好，所以我来</FONT></P>
<P><FONT size=3>申诉。」申诉通过的大概只有百分之十，那么我的责任就是在百分之九十未通过的案子</FONT></P>
<P><FONT size=3>正式判决前，再拿来看一看。有几个印象最深常常被拿出来讨论的，就是这个题目不必</FONT></P>
<P><FONT size=3>再做了、这个题目本身没有发展性，所以使我更加确认选对一个有意义、有延展性、可</FONT></P>
<P><FONT size=3>控制、可以经营的题目是非常重要的。</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 我的学生常常选非常难的题目，我说你千万不要这样，因为没有人会仔细去看你研</FONT></P>
<P><FONT size=3>究的困难度，对于难的题目你要花更多的时间阅读史料，才能得到一点点东西；要挤很</FONT></P>
<P><FONT size=3>多东西，才能筛选出一点点内容，所以你最好选择一个难易适中的题目。</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 我写过好几本书，我认为我对每一本书的花的心力都是一样，虽然我写任何东西我</FONT></P>
<P><FONT size=3>都不满意，但是在过程中我都绞尽脑汁希望把他写好。目前为止很多人认为我最好的书</FONT></P>
<P><FONT size=3>，是我二十几岁刚到史语所那一年所写的那本书。我在那本书花的时间并不长，那本书</FONT></P>
<P><FONT size=3>的大部分的稿子，是我和许添明老师同时在当兵的军营里面写的，而且还是用我以前旧</FONT></P>
<P><FONT size=3>的笔记写的。大陆这些年有许多出版社，反复要求出版我以前的书，尤其是这一本，我</FONT></P>
<P><FONT size=3>说：「不行。」因为我用的是我以前的读书笔记，我怕引文有错字，因为在军队营区里</FONT></P>
<P><FONT size=3>面随时都要出操、随时就要集合，手边又没有书，怎么可能好好的去核对呢？而如果要</FONT></P>
<P><FONT size=3>我重新校正一遍，又因为引用太多书，实在没有力气校正。</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 为什么举这个例子呢？我后来想一想，那本书之所以比较好，可能是因为那个题目</FONT></P>
<P><FONT size=3>可延展性大，那个题目波澜起伏的可能性大。很多人都认为，我最好的书应该是剑桥大</FONT></P>
<P><FONT size=3>学出的那一本，不过我认为我最好的书一定是用中文写的，因为这个语文我能掌握，英</FONT></P>
<P><FONT size=3>文我没办法掌握得出神入化。读、写任何语文一定要练习到你能带着三分随意，那时候</FONT></P>
<P><FONT size=3>你才可以说对于这一个语文完全理解与精熟，如果你还无法达到三分的随意，就表示你</FONT></P>
<P><FONT size=3>还在摸索。</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 回到我刚刚讲的，其实每一本书、每一篇论文我都很想把它写好。但是有些东西没</FONT></P>
<P><FONT size=3>办法写好，为什么？因为一开始选择的题目不够好。因此唯有选定题目以后，你的所有</FONT></P>
<P><FONT size=3>训练跟努力才有价值。我在这里建议大家，选题的工作要尽早做，所选的题目所要处理</FONT></P>
<P><FONT size=3>的材料最好要集中，不要太分散，因为硕士生可能只有三年、博士生可能只有五年，如</FONT></P>
<P><FONT size=3>果你的材料太不集中，读书或看数据可能就要花掉你大部分的时间，让你没有余力思考</FONT></P>
<P><FONT size=3>。而且这个题目要适合你的性向，如果你不会统计学或讨厌数字，但却选了一个全都要</FONT></P>
<P><FONT size=3>靠统计的论文，那是不可能做得好。</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 6. 养成遵照学术格式的写作习惯</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 另一个最基本的训练，就是平时不管你写一万字、三万字、五万字都要养成遵照学</FONT></P>
<P><FONT size=3>术规范的习惯，要让他自然天成，就是说你论文的脚注、格式，在一开始进入研究生的</FONT></P>
<P><FONT size=3>阶段就要培养成为你生命中的一个部份，如果这个习惯没有养成，人家就会觉得这个论</FONT></P>
<P><FONT size=3>文不严谨，之后修改也要花很多时间，因为你的论文规模很大，可能几百页，如果一开</FONT></P>
<P><FONT size=3>始弄错了，后来再重头改到尾，一定很耗时费力，因此要在一开始就养成习惯，因为我</FONT></P>
<P><FONT size=3>们是在写论文而不是在写散文，哪一个逗点应该在哪里、哪一个书名号该在哪里、哪一</FONT></P>
<P><FONT size=3>个地方要用引号、哪一个要什么标点符号，都有一定的规定，用中文写还好，用英文有</FONT></P>
<P><FONT size=3>一大堆简称。在 1960 年代台湾知识还很封闭的时候，有一个人从美国回来就说：「美</FONT></P>
<P><FONT size=3>国有个不得了的情形，因为有一个人非常不得了。」有人问他为什么不得了，他说：「</FONT></P>
<P><FONT size=3>因为这个人的作品到处被引用。」他的名字就叫 ibid 。所谓 ibid 就是同前作者，这</FONT></P>
<P><FONT size=3>个字是从拉丁文发展出来的，拉丁文有一大堆简称，像 et. al. 就是两人共同编的。英</FONT></P>
<P><FONT size=3>文有一本 The Chicago Manual of Style 就是专门说明这一些写作规范。各位要尽早学</FONT></P>
<P><FONT size=3>会中英文的写作规范，慢慢练习，最后随性下笔，就能写出符合规范的文章。</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 7. 善用图书馆</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 图书馆应该是研究生阶段最重要的地方，不必读每一本书，可是要知道有哪些书。</FONT></P>
<P><FONT size=3>我记得我做学生时，新进的书都会放在图书馆的墙上，而身为学生最重要的事情，就是</FONT></P>
<P><FONT size=3>要把书名看一看。在某些程度上知道书皮就够了，但是这仍和打计算机是不一样的，你</FONT></P>
<P><FONT size=3>要实际上熟悉一下那本书，摸一下，看一眼目录。我知道现在从计算机就可以查到书名</FONT></P>
<P><FONT size=3>，可是我还是非常珍惜这种定期去 browse 新到的书的感觉，或去看看相关领域的书长</FONT></P>
<P><FONT size=3>成什么样子。中研院有一位院士是哈佛大学信息教授，他告诉我他在创造力最高峰的时</FONT></P>
<P><FONT size=3>候，每个礼拜都到他们信息系图书室里，翻阅重要的信息期刊。所以图书馆应该是身为</FONT></P>
<P><FONT size=3>研究生的人们，最熟悉的地方。不过切记不重要的不要花时间去看，你们生活在信息泛</FONT></P>
<P><FONT size=3>滥的时代，跟我生长在信息贫乏的时代是不同的，所以生长在这一个时代的你，要能有</FONT></P>
<P><FONT size=3>所取舍。我常常看我的学生引用一些三流的论文，却引得津津有味，我都替他感到难过</FONT></P>
<P><FONT size=3>，因为我强调要读有用、有价值的东西。</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 8. 留下时间，精致思考</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 还要记得给自己保留一些思考的时间。一篇论文能不能出神入化、能不能引人入胜</FONT></P>
<P><FONT size=3>，很重要的是在现象之上作概念性的思考，但我不是说一定要走理论的路线，而是提醒</FONT></P>
<P><FONT size=3>大家要在一般的层次再提升两三步， conceptualize 你所看到的东西。真切去了解，你</FONT></P>
<P><FONT size=3>所看到的东西是什么？整体意义是什么？整体的轮廓是什么？千万不要被枝节淹没，虽</FONT></P>
<P><FONT size=3>然枝节是你最重要的开始，但是你一天总也要留一些时间好好思考、慢慢沉淀。 conce</FONT></P>
<P><FONT size=3>ptualize 是一种非常难教的东西，我记得我念书时，有位老师信誓旦旦说要开一门课，</FONT></P>
<P><FONT size=3>教学生如何 conceptualize ，可是从来都没开成，因为这非常难教。我要提醒的是，在</FONT></P>
<P><FONT size=3>被很多材料和枝节淹没的时候，要适时跳出来想一想，所看到的东西有哪些意义？这个</FONT></P>
<P><FONT size=3>意义有没有广泛连结到更大层面的知识价值。</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 傅斯年先生来到台湾以后，同时担任中央研究院历史语言研究所的所长及台大的校</FONT></P>
<P><FONT size=3>长。台大有个傅钟每小时钟声有二十一响、敲二十一次。以前有一个人，写了一本书叫</FONT></P>
<P><FONT size=3>《钟声二十一响》，当时很轰动。他当时对这二十一响解释是说：因为台大的学生都很</FONT></P>
<P><FONT size=3>好，所以二十一响是欢迎国家元首二十一响的礼炮。不久前我发现台大在每一个重要的</FONT></P>
<P><FONT size=3>古迹下面竖一个铜牌，我仔细看看傅钟下的解释，才知道原来是因为傅斯年当台大校长</FONT></P>
<P><FONT size=3>的时候，曾经说过一句话：「人一天只有二十一个小时，另外三小时是要思考的。」所</FONT></P>
<P><FONT size=3>以才叫二十一响。我觉得这句话大有道理，可是我觉得三小时可能太多，因为研究生是</FONT></P>
<P><FONT size=3>非常忙的，但至少每天要留个三十分钟、一小时思考，想一想你看到了什么？学习跳到</FONT></P>
<P><FONT size=3>比你所看到的东西更高一点的层次去思考。</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 9. 找到学习的楷模</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 我刚到美国念书的时候，每次写报告头皮就重的不得了，因为我们的英文报告三、</FONT></P>
<P><FONT size=3>四十页，一个学期有四门课的话就有一百六十页，可是你连脚注都要从头学习。后来我</FONT></P>
<P><FONT size=3>找到一个好办法，就是我每次要写的时候，把一篇我最喜欢的论文放在旁边，虽然他写</FONT></P>
<P><FONT size=3>的题目跟我写的都没关系，不过我每次都看他如何写，看看他的注脚、读几行，然后我</FONT></P>
<P><FONT size=3>就开始写。就像最有名的男高音 Pavarotti 唱歌剧的时候都会捏着一条手帕，因为他说</FONT></P>
<P><FONT size=3>：「上舞台就像下地狱，太紧张了。」他为了克服紧张，他有习惯性的动作，就是捏着</FONT></P>
<P><FONT size=3>白手帕。我想当年那一篇论文抽印本就像是我的白手帕一样，能让我开始好好写这篇报</FONT></P>
<P><FONT size=3>告，我学习它里面如何思考、如何构思、如何照顾全体、如何用英文作脚注。好好的把</FONT></P>
<P><FONT size=3>一位大师的作品读完，开始模仿和学习他，是入门最好的方法，逐步的，你也开始写出</FONT></P>
<P><FONT size=3>自己的东西。我也常常鼓励我的学生，出国半年或是一年到国外看看。像现在国科会有</FONT></P>
<P><FONT size=3>各式各样的机会，可以增长眼界，可以知道现在的餐馆正在卖些什么菜，回来后自己要</FONT></P>
<P><FONT size=3>作菜也才知道要如何着手。</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 四、用两条腿走路，练习培养自己的兴趣</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 最后还有一点很重要的，就是我们的人生是两只脚，我们不是靠一只脚走路。做研</FONT></P>
<P><FONT size=3>究生的时代，固然应该把所有的心思都放在学业上，探索你所要探索的那些问题，可是</FONT></P>
<P><FONT size=3>那只是你的一只脚，另外还有一只脚是要学习培养一、两种兴趣。很多人后来会发现他</FONT></P>
<P><FONT size=3>的右脚特别肥重（包括我自己在内），也就是因为忘了培养左脚。很多很有名的大学者</FONT></P>
<P><FONT size=3>最后都陷入极度的精神困扰之中，就是因为他只是培养他的右脚，他忘了培养他的左脚</FONT></P>
<P><FONT size=3>，他忘了人生用两只脚走路，他少了一个小小的兴趣或嗜好，用来好好的调解或是排遣</FONT></P>
<P><FONT size=3>自己。</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 去年夏天，香港《亚洲周刊》要访问我，我说：「我不想接受访问，我不是重要的</FONT></P>
<P><FONT size=3>人。」可是后来他们还是把一个简单的对话刊出来了，里面我只记得讲了一段话：做一</FONT></P>
<P><FONT size=3>个研究生或一个学者，有两个感觉最重要 -- 责任感与罪恶感。你一定要有很大的责任</FONT></P>
<P><FONT size=3>感，去写出好的东西，如果责任感还不够强，还要有一个罪恶感，你会觉得如果今天没</FONT></P>
<P><FONT size=3>有好好做几个小时的工作的话，会有很大的罪恶感。除非是了不得的天才，不然即使爱</FONT></P>
<P><FONT size=3>因斯坦也是需要很努力的。很多很了不得的人，他只是把所有的努力集中在一百页里面</FONT></P>
<P><FONT size=3>，他花了一千小时和另外一个人只花了十个小时，相对于来说，当然是那花一千个小时</FONT></P>
<P><FONT size=3>所写出来的文章较好。所以为什么说要赶快选定题目？因为如果太晚选定一个题目，只</FONT></P>
<P><FONT size=3>有一年的时间可以好好耕耘那个题目，早点选定可以有二、三年耕耘那个题目，是三年</FONT></P>
<P><FONT size=3>做出的东西好，还是一年的东西好？如果我们的才智都一样的话，将三年的努力与思考</FONT></P>
<P><FONT size=3>都灌在上面，当然比一年还要好。</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 五、营造卓越的大学，分享学术的氛围</FONT></P>
<P><FONT size=3>&nbsp;&nbsp;&nbsp; 现在很多人都在讨论，何谓卓越的大学？我认为一个好的大学，学校生活的一大部</FONT></P>
<P><FONT size=3>份，以及校园的许多活动，直接或间接都与学问有关，同学在咖啡厅里面谈论的，直接</FONT></P>
<P><FONT size=3>或间接也都会是学术相关的议题。教授们在餐厅里面吃饭，谈的是「有没有新的发现」</FONT></P>
<P><FONT size=3>？或是哪个人那天演讲到底讲了什么重要的想法？一定是沉浸在这种氛围中的大学，才</FONT></P>
<P><FONT size=3>有可能成为卓越大学。那种交换思想学识、那种互相教育的气氛不是花钱就有办法获得</FONT></P>
<P><FONT size=3>的。我知道钱固然重要，但不是唯一的东西。一个卓越的大学、一个好的大学、一个好</FONT></P>
<P><FONT size=3>的学习环境，表示里面有一个共同关心的焦点，如果没有的话，这个学校就不可能成为</FONT></P>
<P><FONT size=3>好的大学。</FONT></P></div>]]></description>
	    <author><![CDATA[mjliao]]></author>
	    <comments>http://mjliao.blog.163.com/blog/static/375351932007111671914375</comments>
    <slash:comments>0</slash:comments>
    <guid isPermaLink="true">http://mjliao.blog.163.com/blog/static/375351932007111671914375</guid>
    <pubDate>Sun, 16 Dec 2007 19:19:14 +0800</pubDate>
    <dcterms:modified>2007-12-17T14:26:51+08:00</dcterms:modified>
  </item>    
  <item>
  	<title><![CDATA[幸福和快乐之路]]></title>	
    <link>http://mjliao.blog.163.com/blog/static/3753519320071011852251</link>
    <description><![CDATA[<div><P>幸福和快乐之路就在于两个简单的原则：</P>
<P>1、找出自己的兴趣和擅长所在；</P>
<P>2、然后全身心地投入其中，将你所拥有地每一点精力、干劲和才能，统统奉献给你。</P>
<P>简单的解决办法：无论你身在何处，都要最大限度地利用自己的时间。你要即可行动起来，彻底地感受自己的每一次经历。</P>
<P>借助于一些节省时间的技巧，你的时间安排将变得十分有效。这样，你就再也不用为别处尚未完成的事务而牵肠挂肚了。</P>
<P>无论过去曾经发生了什么，我们总是能想方设法地找到快乐，或者是找出这些遭遇地深层意义。</P>
<P>为什么一个人会选择陷入挣扎？问题就在于：当有人被发现正在为某种困难而挣扎时，他就极有可能会赢得别人的同情，并为自己的懒散和懈怠找到了一个很好的借口。这样他们就可以更加心安理得地挣扎下去了。</P>
<P>你是否听到自己对有些事情地抱怨有点儿过于频繁、过于热衷？你是否正在开辟新的天地？还是一直在不断地老调重弹？这些抱怨是否正在变得越来越令人厌烦？你是否已经厌倦了自己的抱怨？</P><BR><BR><BR>本文出自:&nbsp;&nbsp;<A href="http://sunxiaosan.blog.sohu.com/67888487.html"></A></div>]]></description>
	    <author><![CDATA[mjliao]]></author>
	    <comments>http://mjliao.blog.163.com/blog/static/3753519320071011852251</comments>
    <slash:comments>0</slash:comments>
    <guid isPermaLink="true">http://mjliao.blog.163.com/blog/static/3753519320071011852251</guid>
    <pubDate>Sun, 11 Nov 2007 20:05:02 +0800</pubDate>
    <dcterms:modified>2007-11-11T20:05:02+08:00</dcterms:modified>
  </item>    
  <item>
  	<title><![CDATA[用jb连接mysql数据库过程]]></title>	
    <link>http://mjliao.blog.163.com/blog/static/37535193200710710554963</link>
    <description><![CDATA[<div>用jb连接mysql数据库过程： <BR>一首先在<A href="http://www.mysql.com/downloads/download.php?file=downloads/" target=_blank>http://www.mysql.com/downloads/download.php?file=downloads/</A> <BR>connector-j/mysql-connector-java-2.0.14.zip下载mysql的jdbc驱动.下载后，解压缩。 <BR>二打开jbuilder，选择tools-- &gt;configure libraries，然后在左边的列表框下选择new， <BR>填入：name:mysql，location:user home，然后点击add，加入目录f:\mysql-connector <BR>-java-2.0.14\mysql-connector-java-2.0.14\mysql-connector-java-2.0.14-bin.jar <BR>(选择路径后，窗体中的路径最后文件后缀为.jar)，确定 <BR>三、project-- &gt;prject properties-- &gt;paths-- &gt;required libraries-- &gt;add <BR>加入刚才添加的user home/mysql确定 <BR>四、tools-- &gt;enterprise setup-- &gt;database drivers-- &gt;add，加入user home/mysql， <BR>添加之后在列表框中显示的是mysql.config，确定 <BR>五、tools-- &gt;database pilot-- &gt;view-- &gt;options-- &gt;drivers-- &gt;add 填入 <BR>driver class:com.mysql.jdbc.driver <BR>simple url:mysql://localhost:3306/mysql <BR>确定之后，tools-- &gt;database pilot-- &gt;new的driver里选择 <BR>com.mysql.jdbc.driver <BR>在url里填入： <BR>jdbc:mysql://服务器ip地址或主机名:3306/mysql。（服务器ip地址或主机名：我用的是:localhost）确定！ <BR>双击或点击+号输入mysql数据库的用户名和密码，就完成了jb与mysql的连接. <BR>连接代码可以参考faq文章中jb连接sqlser2000！的源码。<BR><BR><BR>本文出自:&nbsp;&nbsp;<A href="http://zhidao.baidu.com/question/15799248.html"></A></div>]]></description>
	    <author><![CDATA[mjliao]]></author>
	    <comments>http://mjliao.blog.163.com/blog/static/37535193200710710554963</comments>
    <slash:comments>0</slash:comments>
    <guid isPermaLink="true">http://mjliao.blog.163.com/blog/static/37535193200710710554963</guid>
    <pubDate>Wed, 7 Nov 2007 22:55:04 +0800</pubDate>
    <dcterms:modified>2007-11-07T22:55:04+08:00</dcterms:modified>
  </item>    
  <item>
  	<title><![CDATA[请输入标题]]></title>	
    <link>http://mjliao.blog.163.com/blog/static/3753519320079238211480</link>
    <description><![CDATA[<div>&lt;div align=center&gt; &lt;embed allowScriptAccess="never" allowNetworking="internal" src="http://cimg3.163.com/cnews/07/10/moonblog.swf" FlashVars="fid=11423" pluginspage="http://www.macromedia.com/go/getflashplayer" type="application/x-shockwave-flash" wmode="transparent" quality="high" width="220" height="220"&gt;&lt;/embed&gt;&lt;br&gt; &lt;a href="http://go.news.163.com/moon/index.html?id=11423" target="_blank"&gt;[详情]&lt;/a&gt;&lt;a target="_blank" href="http://go.news.163.com/moon"&gt;&lt;font color="#8C8C8C" style="font-size:12px"&gt;[我也要建房子]&lt;/font&gt;&lt;/a&gt;&lt;a target="_blank" href="http://news.163.com/moon"&gt;&lt;font color="#0000FF" style="font-size:12px"&gt;[嫦娥探月]&lt;/font&gt;&lt;/a&gt;&lt;/br&gt;&lt;/div&gt; <BR><BR><BR>本文出自:&nbsp;&nbsp;<A href="http://go.news.163.com/news/moon/sourceCode.jsp?id=11423"></A></div>]]></description>
	    <author><![CDATA[mjliao]]></author>
	    <comments>http://mjliao.blog.163.com/blog/static/3753519320079238211480</comments>
    <slash:comments>0</slash:comments>
    <guid isPermaLink="true">http://mjliao.blog.163.com/blog/static/3753519320079238211480</guid>
    <pubDate>Tue, 23 Oct 2007 20:02:11 +0800</pubDate>
    <dcterms:modified>2007-10-23T20:02:11+08:00</dcterms:modified>
  </item>    
  <item>
  	<title><![CDATA[我们离诺贝尔奖还有多远]]></title>	
    <link>http://mjliao.blog.163.com/blog/static/375351932007915982261</link>
    <description><![CDATA[<div><DIV>
<H1>周庆安：我们离诺贝尔奖还有多远</H1>
<DIV>http://www.sina.com.cn 2007年10月13日06:39 <SPAN><A style="TEXT-DECORATION: none" href="http://www.thebeijingnews.com/" target=_blank>新京报</A> </SPAN></DIV></DIV><!--正文内容开始--><!-- google_ad_section_start -->
<DIV>
<P>　　<STRONG>作者：周庆安</STRONG></P>
<P>　　10月8日，随着2007年度诺贝尔生理/医学奖的公布，一年一度的诺贝尔奖季又将开始。截至10月15日，<A href="http://news.sina.com.cn/w/2007-10-12/193112717276s.shtml" target=_blank>诺贝尔物理学奖、化学奖、文学奖、和平奖、经济学奖将陆续揭晓</A>。这一次的生理/医学奖由来自美国的马里奥·卡佩奇、奥利弗·史密斯和来自英国的马丁·伊文思因胚胎干细胞研究而分享。</P>
<P>　　每一次诺贝尔奖颁奖，总会引发国人对于中国科学家获奖的期待。在过去的几十年时间中，代表世界最高科学褒奖的诺贝尔奖从未落在中华大地上。这让许多中国人为之扼腕。个中原因众多学者自有高论，但是前一段时间中科院院士王绶绾先生的断言却从根本上谈到了诺奖在中国的尴尬，他说：应试教育出不了诺贝尔奖。这句话得了教育研究的真谛。与应试教育相对照的素质教育在中国也推行了一段时间，在部分城市和地区的中小学中获得了一定的认可。但是从目前许多中小学生家长的反应来看，在高考这个最大的考试指挥棒之下，应试教育仍然是教育体系的主旋律。即便是刚刚过去的暑假和十一黄金周，也成了学生们准备各种考试的“黄金时间”。</P>
<P>　　从广义上看，应试教育也对目前的科研体系和自主创新体系带来了负面影响。在某些领域，虽然不再有考试标杆，但是同样有“应试思维”。上海社会科学院社会学所学者张结海就曾经讲过一个故事，在他听过的一堂地理课上，老师问学生，你们看<SPAN> <A title=中国地图 href="http://www.iask.com/n?k=%D6%D0%B9%FA%B5%D8%CD%BC" target=_blank false;?>中国地图</A></SPAN>像什么？有的同学说像公鸡，有的同学说像山羊。接下来老师一再问后者，“你们再看看真的像山羊吗？”他把“再”字说得震天响。于是那些同学胆怯地说：“像公鸡”。</P>
<P>　　而论文挂帅等非学术因素的干扰，让那些十年磨一剑的科学工作者，变成了“一年打十件”的计件工人。而科学研究的最高境界，恰恰就在于取乎法上。这是一个没有标准答案的自由空间，诺奖得主们通过创造性的研究和开拓性的思想，来夺取世界科学技术领域的皇冠。诺贝尔物理学奖评委会官员就曾经对新华社记者解释说：宽松的研究环境、让思想自由奔驰的学术氛围和勇于接受挑战的科研态度，是创造诺贝尔奖得主的沃土。</P>
<P>　　应试教育的最大问题，恰恰就在于通过不断的标准化和试卷化，让应试者和教育者都失去了创造力，失去了开拓精神。当这个世界上所有问题的答案都唯一的时候，我们还怎么来创造新的科学技术成果，选拔新的诺贝尔奖得主。更重要的是，学习的目的是为了再创造，如果学习的目的仅仅是为了通过考试，或者在考试中获得高分，那么我们很难想象学习和研究的乐趣在哪里。而2001年诺奖得主保罗·内斯恰恰说，没有兴趣，他完全不可能完成枯燥的研究。</P>
<P>　　当然，有没有诺贝尔奖获得者，并不完全是衡量一个国家教育水平高下的标准。在目前世界范围内，也没有一个国家是以培养诺贝尔奖获得者作为教育的最高目标的。但是诺贝尔奖所象征的最高科学贡献，却是始终不变的。诺贝尔奖之所以成为衡量各国科学技术发展的一个重要指标，也正是因为这些诺奖得主们为世界提供了一个新的思想和技术前景，而不是一套新的科学标准。</P>
<P>　　教育发展是有阶段性的。如果说在过去的几十年时间中，因为教育资源的局限，我们不得不以应试教育作为一种并非最好但却可取的选拔标准，来培养人才的话；那么今天教育资源的发展和教育观念的变革，足以让国人有机会对应试教育进行变革。问题只不过在于，我们有没有这样的动力和魄力。在目前这个阶段，中国人恐怕还要多想想诺贝尔奖以外的一些现实问题。</P>
<P>　　□周庆安(<SPAN> <A title=清华大学 href="http://www.iask.com/n?k=%C7%E5%BB%AA%B4%F3%D1%A7" target=_blank false;?>清华大学</A></SPAN>教师) </P></DIV><BR><BR><BR>本文出自:&nbsp;&nbsp;<A href="http://news.sina.com.cn/pl/2007-10-13/063914076942.shtml"></A></div>]]></description>
	    <author><![CDATA[mjliao]]></author>
	    <comments>http://mjliao.blog.163.com/blog/static/375351932007915982261</comments>
    <slash:comments>0</slash:comments>
    <guid isPermaLink="true">http://mjliao.blog.163.com/blog/static/375351932007915982261</guid>
    <pubDate>Mon, 15 Oct 2007 21:08:02 +0800</pubDate>
    <dcterms:modified>2007-10-15T21:08:02+08:00</dcterms:modified>
  </item>    
  <item>
  	<title><![CDATA[比尔&quot;盖茨写给青年人的十一点忠告]]></title>	
    <link>http://mjliao.blog.163.com/blog/static/3753519320079592746234</link>
    <description><![CDATA[<div><DIV align=center><STRONG><FONT style="FONT-SIZE: 20px; FONT-FAMILY: 黑体" color=#ff0000>比尔"盖茨写给青年人的十一点忠告</FONT></STRONG></DIV>
<DIV align=center>&nbsp;</DIV>
<DIV align=center>
<TABLE cellSpacing=0 cellPadding=0 border=0>
<TBODY>
<TR>
<TD></TD></TR></TBODY></TABLE></DIV>
<DIV align=center>
<TABLE style="WIDTH: 525px; HEIGHT: 411px" cellSpacing=1 width=525 bgColor=#ffffff border=0>
<TBODY>
<TR bgColor=#e6e9ff>
<TD vAlign=top align=middle bgColor=#e6e9ff>
<P><STRONG><FONT size=5>1</FONT></STRONG></P></TD>
<TD>
<TABLE style="WIDTH: 485px; HEIGHT: 79px" height=79 cellSpacing=1 cellPadding=10 width=485 bgColor=#ffffff border=0>
<TBODY>
<TR bgColor=#e6e9ff>
<TD>英文</TD>
<TD>Life is not fair, get used to it.</TD></TR>
<TR bgColor=#e6e9ff>
<TD><FONT color=#000099>中文</FONT></TD>
<TD><FONT color=#000099>生活是不公平的；要去适应它。</FONT></TD></TR></TBODY></TABLE></TD></TR>
<TR bgColor=#e6e9ff>
<TD vAlign=top align=middle bgColor=#e6e9ff><STRONG><FONT size=5>2</FONT></STRONG></TD>
<TD>
<TABLE style="WIDTH: 487px; HEIGHT: 129px" height=129 cellSpacing=1 cellPadding=10 width=487 bgColor=#ffffff border=0>
<TBODY>
<TR bgColor=#e6e9ff>
<TD>英文</TD>
<TD>The world won't care about your self-esteem. The world will expect you to accomplish something before you feel good about yourself.</TD></TR>
<TR bgColor=#e6e9ff>
<TD><FONT color=#000099>中文</FONT></TD>
<TD bgColor=#e6e9ff><FONT color=#000099>这世界并不会在意你的自尊。这世界指望你在自我感觉良好之前先要有所成就。</FONT></TD></TR></TBODY></TABLE></TD></TR>
<TR bgColor=#e6e9ff>
<TD vAlign=top align=middle bgColor=#e6e9ff><STRONG><FONT size=5>3</FONT></STRONG></TD>
<TD>
<TABLE style="WIDTH: 487px; HEIGHT: 127px" cellSpacing=1 cellPadding=10 width=487 bgColor=#ffffff border=0>
<TBODY>
<TR bgColor=#e6e9ff>
<TD>英文</TD>
<TD>You will not make 40 thousand dollars a year right out of high school. You won"t be a vice president with a car phone, until you earn both.</TD></TR>
<TR bgColor=#e6e9ff>
<TD><FONT color=#000099>中文</FONT></TD>
<TD><FONT color=#000099>高中刚毕业你不会一年挣4万美元。你不会成为一个公司的副总裁，并拥有一部装有电话的汽车，直到你将此职位和汽车电话都挣到手。</FONT></TD></TR></TBODY></TABLE></TD></TR></TBODY></TABLE></DIV>
<DIV align=center></DIV>
<DIV align=center>
<TABLE style="WIDTH: 524px; HEIGHT: 415px" cellSpacing=1 width=524 bgColor=#ffffff border=0>
<TBODY>
<TR bgColor=#e6e9ff>
<TD vAlign=top align=middle bgColor=#e6e9ff>
<P><FONT size=5><STRONG>4</STRONG><BR></FONT></P></TD>
<TD>
<TABLE cellSpacing=1 cellPadding=10 width="100%" bgColor=#ffffff border=0>
<TBODY>
<TR bgColor=#e6e9ff>
<TD>英文</TD>
<TD>If you think your teacher is tough, wait till you get a boss. He doesn't have tenure.</TD></TR>
<TR bgColor=#e6e9ff>
<TD><FONT color=#000099>中文</FONT></TD>
<TD><FONT color=#000099>如果你认为你的老师严厉，等你有了老板再这样想。老板可是没有任期限制的。</FONT></TD></TR></TBODY></TABLE></TD></TR>
<TR bgColor=#e6e9ff>
<TD vAlign=top align=middle bgColor=#e6e9ff><STRONG><FONT size=5>5</FONT></STRONG></TD>
<TD>
<TABLE cellSpacing=1 cellPadding=10 width="100%" bgColor=#ffffff border=0>
<TBODY>
<TR bgColor=#e6e9ff>
<TD>英文</TD>
<TD>Flipping burgers is not beneath your dignity. Your grandparents had a different word for burger flipping; they called it opportunity.</TD></TR>
<TR bgColor=#e6e9ff>
<TD><FONT color=#000099>中文</FONT></TD>
<TD><FONT color=#000099>烙牛肉饼并不有损你的尊严。你的祖父母对烙牛肉饼可有不同的定义；他们称它为机遇。</FONT></TD></TR></TBODY></TABLE></TD></TR>
<TR bgColor=#e6e9ff>
<TD vAlign=top align=middle bgColor=#e6e9ff><STRONG><FONT size=5>6</FONT></STRONG></TD>
<TD>
<TABLE cellSpacing=1 cellPadding=10 width="100%" bgColor=#ffffff border=0>
<TBODY>
<TR bgColor=#e6e9ff>
<TD>英文</TD>
<TD>If you mess up, it's not your parents' fault, so don't whine about our mistakes, learn from them.</TD></TR>
<TR bgColor=#e6e9ff>
<TD><FONT color=#000099>中文</FONT></TD>
<TD><FONT color=#000099>如果你陷入困境，那不是你父母的过错，所以不要尖声抱怨我们的错误，要从中吸取教训。</FONT></TD></TR></TBODY></TABLE></TD></TR></TBODY></TABLE></DIV>
<P align=center></P>
<P align=center></P>
<TABLE style="WIDTH: 506px; HEIGHT: 245px" cellSpacing=1 cellPadding=10 width=506 bgColor=#ffffff border=0>
<TBODY>
<TR bgColor=#e6e9ff>
<TD>英文</TD>
<TD>Before you were born, your parents weren't as boring as they are now. They got that way from paying your bills, cleaning your clothes and listening to you talk about how cool you are. So before you save the rain forest from the parasites of your parents' generation, try "delousing' the closet in your own room.</TD></TR>
<TR bgColor=#e6e9ff>
<TD><FONT color=#000099>中文</FONT></TD>
<TD><FONT color=#000099>在你出生之前，你的父母并非像他们现在这样乏味。他们变成今天这个样子是因为这些年来他们一直在为你付账单，给你洗衣服，听你大谈你是如何的酷。所以，如果你想消灭你父母那一辈中的"寄生虫"来拯救雨林的话，还是先去清除你房间衣柜里的虫子吧。</FONT></TD></TR></TBODY></TABLE>
<P align=center></P>
<TABLE style="WIDTH: 504px; HEIGHT: 393px" cellSpacing=1 width=504 bgColor=#ffffff border=0>
<TBODY>
<TR bgColor=#e6e9ff>
<TD vAlign=top align=middle bgColor=#e6e9ff>
<P><STRONG><FONT size=5>8</FONT></STRONG><BR></P></TD>
<TD>
<TABLE cellSpacing=1 cellPadding=10 width="100%" bgColor=#ffffff border=0>
<TBODY>
<TR bgColor=#e6e9ff>
<TD>英文</TD>
<TD>Your school may have done away with winners and losers, but life has not. In some schools they have abolished failing grades; they'll give you as many times as you want to get the right answer. This doesn't bear the slightest resemblance to anything in real life.</TD></TR>
<TR bgColor=#e6e9ff>
<TD><FONT color=#000099>中文</FONT></TD>
<TD><FONT color=#000099>你的学校也许已经不再分优等生和劣等生，但生活却仍在作出类似区分。在某些学校已经废除不及格分；只要你想找到正确答案，学校就给你无数的机会。这和现实生活中的任何事情没有一点相似之处。</FONT></TD></TR></TBODY></TABLE></TD></TR>
<TR bgColor=#e6e9ff>
<TD vAlign=top align=middle bgColor=#e6e9ff><STRONG><FONT size=5>9</FONT></STRONG></TD>
<TD>
<TABLE cellSpacing=1 cellPadding=10 width="100%" bgColor=#ffffff border=0>
<TBODY>
<TR bgColor=#e6e9ff>
<TD>英文</TD>
<TD>Life is not divided into semesters. You don't get summers off and very few employers are interested in helping you find yourself. Do that on your own time.</TD></TR>
<TR bgColor=#e6e9ff>
<TD><FONT color=#000099>中文</FONT></TD>
<TD><FONT color=#000099>生活不分学期。你并没有暑假可以休息，也没有几位雇主乐于帮你发现自我。自己找时间做吧。</FONT></TD></TR></TBODY></TABLE></TD></TR></TBODY></TABLE>
<TABLE cellSpacing=0 cellPadding=0 border=0>
<TBODY>
<TR>
<TD></TD></TR></TBODY></TABLE>
<P align=center></P>
<TABLE style="WIDTH: 514px; HEIGHT: 281px" cellSpacing=1 width=514 bgColor=#ffffff border=0>
<TBODY>
<TR bgColor=#e6e9ff>
<TD vAlign=top align=middle bgColor=#e6e9ff>
<P><STRONG><FONT size=5>10</FONT></STRONG></P></TD>
<TD>
<TABLE cellSpacing=1 cellPadding=10 width="100%" bgColor=#ffffff border=0>
<TBODY>
<TR bgColor=#e6e9ff>
<TD>英文</TD>
<TD>Television is NOT real life. In real life people actually have to leave the coffee shop and go to jobs.</TD></TR>
<TR bgColor=#e6e9ff>
<TD><FONT color=#000099>中文</FONT></TD>
<TD><FONT color=#000099>电视并不是真实的生活。在现实生活中，人们实际上得离开咖啡屋去干自己的工作。</FONT></TD></TR></TBODY></TABLE></TD></TR>
<TR bgColor=#e6e9ff>
<TD vAlign=top align=middle bgColor=#e6e9ff><STRONG><FONT size=5>11</FONT></STRONG></TD>
<TD>
<TABLE cellSpacing=1 cellPadding=10 width="100%" bgColor=#ffffff border=0>
<TBODY>
<TR bgColor=#e6e9ff>
<TD>英文</TD>
<TD>Be nice to nerds. Chances are you'll end up working for one.</TD></TR>
<TR bgColor=#e6e9ff>
<TD><FONT color=#000099>中文</FONT></TD>
<TD><FONT color=#000099>善待乏味的人。有可能到头来你会为一个乏味的人工作。</FONT></TD></TR></TBODY></TABLE></TD></TR></TBODY></TABLE><BR><BR><BR>本文出自:&nbsp;&nbsp;<A href="http://blog.sina.com.cn/s/blog_49a2166d01000bal.html"></A></div>]]></description>
	    <author><![CDATA[mjliao]]></author>
	    <comments>http://mjliao.blog.163.com/blog/static/3753519320079592746234</comments>
    <slash:comments>1</slash:comments>
    <guid isPermaLink="true">http://mjliao.blog.163.com/blog/static/3753519320079592746234</guid>
    <pubDate>Fri, 5 Oct 2007 09:27:46 +0800</pubDate>
    <dcterms:modified>2007-10-05T09:27:46+08:00</dcterms:modified>
  </item>    
  <item>
  	<title><![CDATA[我国古代是怎样测评人才的]]></title>	
    <link>http://mjliao.blog.163.com/blog/static/375351932007959193791</link>
    <description><![CDATA[<div><DIV align=center><FONT style="FONT-SIZE: 20px; FONT-FAMILY: 黑体"><STRONG>&nbsp;我国古代是怎样测评人才的</STRONG></FONT></DIV>
<DIV align=center>&nbsp;</DIV>
<DIV align=left><FONT style="FONT-SIZE: 16px; FONT-FAMILY: 幼圆">&nbsp;&nbsp;&nbsp;人才测评在我国古代被称为“知人”。老子认为“知人者智”，把善于知人看作智慧的象征。在人才的识别、甄选历史发展过程中，古代创造了许多人才测评的方法和手段，这对于现代的人才测评活动也具有借鉴意义。<BR><BR>　　<B style="FONT-FAMILY: ">1.分类比较法</B><BR><BR>　　这种方法通常按照一定的标准把人分成不同的类别，并分别列举出不同类型的显著特征，通过特征的匹配进行区别，以达到对人才的鉴别和任用。如，刘劭在《人物志·流业篇》中，将人才划分为12种，包括法家、术家、国体、器能、臧否、伎俩、智意、文章、儒学、口辩、雄杰等，并列举出我国历史上的一些人物加以说明。在分类的基础上，对各个类别又进行细分。如荀子在《荀子·不苟篇第三》中根据人格特征的不同，把士划分为:“通士(尊君爱民、通达事理)、公士(公正无私)、直士(忠厚老实、耿直坦诚)、悫士(诚实可信、谦虚谨慎)、小人(惟利是图、言行无常)。”刘向在《说苑·臣术》篇中则根据人臣的处世之道，划分了“六正”和“六邪”。六正指“圣臣、良臣、忠臣、志臣、贞臣、直臣”，“六邪”指“具臣、谀臣、奸臣、谗臣、贼臣、亡臣”，并分别列举了他们的行为表现，以便于区别。<BR><BR>　　<B style="FONT-FAMILY: ">2.实践鉴别法</B><BR><BR>　　这种方法是在实践中通过人的实际表现，来鉴别人才。孔子曰:“听其言而观其行。”对一个人的评价，既要看他说了什么，更要观察他的实际表现。据《吕氏春秋》记载，实践鉴别法应始于尧舜时期，《吕氏春秋·谨听》描述了尧考察舜的过程，共包括了五个方面:一是把两个女儿嫁给他，并考察舜的品格；二是让舜制定常法，考察他能否服众；三是让舜总理百官，考察他的管理能力；四是让舜接待宾客，考察他的交往能力；五是派舜巡查山林，考察他的实际工作表现。尧对舜的考察可以说是既全面又系统。王充在《论衡·答佞篇》中主张:“以九德检其行，以事效考其言。”王安石认为对人的评价，不能“私听于一人之口”，而应当“审知其德，审知其才”，同时要“试之以事”，看他的具体表现。曾国藩认为择人要优选有节操而没有官气的人，办事情要做到身到(深入基层)、心到(条例清晰)、眼到(明察秋毫)、手到(亲自动手)、口到(命令叮嘱)。<BR><BR>　　<B style="FONT-FAMILY: ">3.自然观察法</B><BR><BR>　　自然观察法强调深入、全面地观察被观察者的言语、行为、表情等内容。具体包括以下几个方面。第一，观言。孔子在《论语·公冶长第五》中提出“听其言而观其行”。第二，观眸。孟子提出通过观眸来了解人的方法，“存乎人者，莫良于眸子。眸子不能掩其恶。胸中正，则眸子嘹焉。胸中不正，则眸子眊焉。听其言也，观其眸子，人焉座哉？”因为眼睛是心灵的反映，心中的正邪都会从中反映出来。第三，观行。孔子认为考察一个人的行为动机，做事的方式，进而洞察他的内心，这样才能全面地了解一个人。据《贞观政要·论择官第七》记载，魏征上疏唐太宗，提出了选人考其行的“六观”法:“贵则观其所举，富则观其所与，居则观其所好，习则观其所言，穷则观其所不受，贱则观其所不为。”第四，观志。《论语·公冶长第五》中记载了孔子经常召集弟子们以谈话的方式了解他们的志向，从而对弟子进行判定。第五，观过。在《论语·里仁第四》中孔子指出:“人之过也，各于其党。观过，斯知仁矣。”意思是人有各种各样，所犯的错误也各式各样。仔细的审查一个人所犯的错误，就可以知道他是一个什么样的人。第六，观亲。如《吕氏春秋》中提出的“六戚四隐”的方法，主张通过观察一个人如何对待他的兄弟姐妹、亲戚朋友以及邻里门生，来考察一个人的个性品德。<BR><BR>　　<B style="FONT-FAMILY: ">4.民意调研法</B><BR><BR>　　在长期的人才评价中，古人提出了应当将群众的观点和意见作为人才评价的一个方面，但同时又提出了“不以舆识人”的主张，认为群众的舆论在一定程度上存在偏差，要区分对待。<BR><BR>　　在考察民意的同时，孔子主张只能把民意作为考察和评价人的参考，既要相信群众，又不能一味地迎合群众，认为世俗之毁誉不足以为根据。在《论语·子路第十三》中，子贡问曰:“乡人皆好之，何如？”子曰:“未可也”，“乡人皆恶之，何如？”子曰:“未可也，不如乡人之善者好之，其不善者恶之。”孔子的主张可以说是非常中肯的，有效地避免了民意调查法的不足。<BR><BR>　　<B style="FONT-FAMILY: ">5.绩效考评法</B><BR><BR>　　绩效考评，在古代又称考绩、考课、考成，顾名思义就是以“业绩”作为选拔人才的标准。东汉王符提出，要根据官吏从政的实际表现奖赏升降，健全官吏的考绩制度。“知贤之近途，莫急于考功”，即认为考绩是考察一个人最直接最有效的方法。<BR><BR>　　西汉时期，董仲舒主张对人的考察应当把业绩作为主要的标准，在《天人三策·第二策》中他对绩效考核有详细的论述，认为有功劳靠的是“任官称职”，而不是“积日累久”。考绩要首先对各级官吏进行考试，“诸侯月试其国，州伯时试其部，四试而一考。天子岁试天下，三试而一考”。其次，根据官吏的爵、禄、秩、功、罪，决定其高下等级和进退。要评出相应的等级，按业绩将官吏分成九个等级，根据等级进行奖惩。五级以上有奖，五级以下要罚，并根据奖惩进行任、免、升、降。董仲舒提出的依据实际绩效定期考核的程序和方法，极大地激发了官吏为政的积极性。<BR><BR>　　<B style="FONT-FAMILY: ">6.实验试探法</B><BR><BR>　　实验试探法类似于我们今天的情景模拟，通过设置一定的情景，观察受测者的反应，进而做出评价。这种方法见于《庄子·列御寇第三十二》中的描述:“故君子远使之而观其忠，近使之而观其敬，烦使之而观其能，卒然问焉而观其知，急与之期而观其信，委之以财而观其仁，告之以危而观其节，醉之以酒而观其侧，杂之以处而观其色。九征至，不肖人得矣。”<BR><BR>　　总体而言，我国古代有关人才测评的思想和方法相当丰富，但是，必须看到，由于受到具体历史条件的限制，也存在着一些局限，如重定性分析，轻量化研究；对人的评价偏向道德层面，对能力的测试不足；测试的内容偏重政治和文化知识，对技术重视不够。不过，古人强调人才测评工作的客观性和全面性，尤其是要求测量要针对本质；在方法和手段上注重综合运用、相互印证，这些对于我们当前的人才测评工作也很有借鉴的价值。</FONT></DIV><BR><BR><BR>本文出自:&nbsp;&nbsp;<A href="http://blog.sina.com.cn/s/blog_49a2166d01000bmf.html"></A></div>]]></description>
	    <author><![CDATA[mjliao]]></author>
	    <comments>http://mjliao.blog.163.com/blog/static/375351932007959193791</comments>
    <slash:comments>0</slash:comments>
    <guid isPermaLink="true">http://mjliao.blog.163.com/blog/static/375351932007959193791</guid>
    <pubDate>Fri, 5 Oct 2007 09:19:37 +0800</pubDate>
    <dcterms:modified>2007-10-05T09:19:37+08:00</dcterms:modified>
  </item>    
  <item>
  	<title><![CDATA[数学之美 系列十六（上） 不要把所有的鸡蛋放在一个篮子里 -- 谈谈最大熵模型]]></title>	
    <link>http://mjliao.blog.163.com/blog/static/37535193200783073855460</link>
    <description><![CDATA[<div><H3><A >数学之美 系列十六（上） 不要把所有的鸡蛋放在一个篮子里 -- 谈谈最大熵模型</A></H3>
<P ><SPAN >2006年10月8日 上午 07:27:00</SPAN></P>


<DIV style="CLEAR: both"></DIV><FONT color=#666666><SPAN >发表者：Google 研究员，吴军 </SPAN><BR><BR></FONT>[我们在投资时常常讲不要把所有的鸡蛋放在一个篮子里，这样可以降低风险。在信息处理中，这个原理同样适用。在数学上，这个原理称为<A href="http://www.wljx.sdu.edu.cn/wlwz/reading/r_infor/shang7.htm" target=_blank>最大熵原理</A>(the maximum entropy principle)。这是一个非常有意思的题目，但是把它讲清楚要用两个系列的篇幅。]<BR><BR>前段时间，Google 中国研究院的刘骏总监谈到在网络搜索排名中，用到的信息有上百种。更普遍地讲，在自然语言处理中，我们常常知道各种各样的但是又不完全确定的信息，我们需要用一个统一的模型将这些信息综合起来。如何综合得好，是一门很大的学问。<BR><BR>让我们看一个拼音转汉字的简单的例子。假如输入的拼音是"wang-xiao-bo"，利用语言模型，根据有限的上下文(比如前两个词)，我们能给出两个最常见的名字“王小波”和“王晓波”。至于要唯一确定是哪个名字就难了，即使利用较长的上下文也做不到。当然，我们知道如果通篇文章是介绍文学的，作家王小波的可能性就较大；而在讨论两岸关系时，台湾学者王晓波的可能性会较大。在上面的例子中，我们只需要综合两类不同的信息，即主题信息和上下文信息。虽然有不少凑合的办法，比如：分成成千上万种的不同的主题单独处理，或者对每种信息的作用加权平均等等，但都不能准确而圆满地解决问题，这样好比以前我们谈到的行星运动模型中的<A href="http://googlechinablog.com/2006/08/blog-post_09.html" target=_blank>小圆套大圆</A>打补丁的方法。在很多应用中，我们需要综合几十甚至上百种不同的信息，这种小圆套大圆的方法显然行不通。<BR><BR>数学上最漂亮的办法是最大熵(maximum entropy)模型，它相当于行星运动的椭圆模型。“最大熵”这个名词听起来很深奥，但是它的原理很简单，我们每天都在用。说白了，就是要保留全部的不确定性，将风险降到最小。让我们来看一个实际例子。<BR><BR>有一次，我去 AT&amp;T 实验室作关于最大熵模型的报告，我带去了一个色子。我问听众“每个面朝上的概率分别是多少”，所有人都说是等概率，即各点的概率均为1/6。这种猜测当然是对的。我问听众们为什么，得到的回答是一致的：对这个“一无所知”的色子，假定它每一个朝上概率均等是最安全的做法。（你不应该主观假设它象韦小宝的色子一样灌了铅。）从投资的角度看，就是风险最小的做法。从信息论的角度讲，就是保留了最大的不确定性，也就是说让熵达到最大。接着，我又告诉听众，我的这个色子被我特殊处理过，已知四点朝上的概率是三分之一，在这种情况下，每个面朝上的概率是多少？这次，大部分人认为除去四点的概率是 1/3，其余的均是 2/15，也就是说已知的条件（四点概率为 1/3）必须满足，而对其余各点的概率因为仍然无从知道，因此只好认为它们均等。注意，在猜测这两种不同情况下的概率分布时，大家都没有添加任何主观的假设，诸如四点的反面一定是三点等等。（事实上，有的色子四点反面不是三点而是一点。）这种基于直觉的猜测之所以准确，是因为它恰好符合了最大熵原理。<BR><BR>最大熵原理指出，当我们需要对一个随机事件的概率分布进行预测时，我们的预测应当满足全部已知的条件，而对未知的情况不要做任何主观假设。（不做主观假设这点很重要。）在这种情况下，概率分布最均匀，预测的风险最小。因为这时概率分布的信息熵最大，所以人们称这种模型叫“最大熵模型”。我们常说，不要把所有的鸡蛋放在一个篮子里，其实就是最大熵原理的一个朴素的说法，因为当我们遇到不确定性时，就要保留各种可能性。<BR><BR>回到我们刚才谈到的拼音转汉字的例子，我们已知两种信息，第一，根据语言模型，wang-xiao-bo 可以被转换成王晓波和王小波；第二，根据主题，王小波是作家，《黄金时代》的作者等等，而王晓波是台湾研究两岸关系的学者。因此，我们就可以建立一个最大熵模型，同时满足这两种信息。现在的问题是，这样一个模型是否存在。匈牙利著名数学家、信息论最高奖香农奖得主希萨（Csiszar）证明，对任何一组不自相矛盾的信息，这个最大熵模型不仅存在，而且是唯一的。而且它们都有同一个非常简单的形式 -- 指数函数。下面公式是根据上下文（前两个词）和主题预测下一个词的最大熵模型，其中 w3 是要预测的词（王晓波或者王小波）w1 和 w2 是它的前两个字（比如说它们分别是“出版”，和“”），也就是其上下文的一个大致估计，subject 表示主题。<BR><BR><IMG style="BORDER-RIGHT: 1px solid; BORDER-TOP: 1px solid; BORDER-LEFT: 1px solid; BORDER-BOTTOM: 1px solid" alt="" src="http://googlechinablog.com/uploaded_images/formula-738534.jpg" width=400 border=0><BR><BR>我们看到，在上面的公式中，有几个参数 lambda 和 Z ，他们需要通过观测数据训练出来。<BR><BR>最大熵模型在形式上是最漂亮的统计模型，而在实现上是最复杂的模型之一。我们在将下一个系列中介绍如何训练最大熵模型的诸多参数，以及最大熵模型在自然语言处理和金融方面很多有趣的应用。</div>]]></description>
	    <author><![CDATA[mjliao]]></author>
	    <comments>http://mjliao.blog.163.com/blog/static/37535193200783073855460</comments>
    <slash:comments>0</slash:comments>
    <guid isPermaLink="true">http://mjliao.blog.163.com/blog/static/37535193200783073855460</guid>
    <pubDate>Sun, 30 Sep 2007 07:38:55 +0800</pubDate>
    <dcterms:modified>2007-09-30T07:38:55+08:00</dcterms:modified>
  </item>    
  <item>
  	<title><![CDATA[数学之美 系列十五 繁与简 自然语言处理的几位精英]]></title>	
    <link>http://mjliao.blog.163.com/blog/static/37535193200783073821954</link>
    <description><![CDATA[<div><H3><A>数学之美 系列十五 繁与简 自然语言处理的几位精英</A></H3>
<P><SPAN>2006年8月23日 下午 11:22:00</SPAN></P>
<DIV style="CLEAR: both"></DIV><SPAN>发表者：吴军，Google 研究员 </SPAN><BR><BR>我在数学之美系列中一直强调的一个好方法就是简单。但是，事实上，自然语言处理中也有一些特例，比如有些学者将一个问题研究到极致，执著追求完善甚至可以说完美的程度。他们的工作对同行有很大的参考价值，因此我们在科研中很需要这样的学者。在自然语言处理方面新一代的顶级人物麦克尔 · 柯林斯 (<A href="http://www.google.cn/search?hl=zh-CN&amp;newwindow=1&amp;q=Michael+Collins&amp;btnG=%E6%90%9C%E7%B4%A2&amp;meta=" target=_blank>Michael Collins</A>) 就是这样的人。<BR><BR><SPAN style="FONT-WEIGHT: bold"><BR>柯林斯：追求完美 </SPAN><BR><BR>柯林斯从师于自然语言处理大师马库斯 (Mitch Marcus)（我们以后还会多次提到马库斯），从宾夕法利亚大学获得博士学位，现任麻省理工学院 (MIT) 副教授（别看他是副教授，他的水平在当今自然语言处理领域是数一数二的），在作博士期间，柯林斯写了一个后来以他名字命名的自然语言文法分析器 (sentence parser)，可以将书面语的每一句话准确地进行文法分析。文法分析是很多自然语言应用的基础。虽然柯林斯的师兄布莱尔 (Eric Brill) 和 Ratnaparkhi 以及师弟 Eisnar 都完成了相当不错的语言文法分析器，但是柯林斯却将它做到了极致，使它在相当长一段时间内成为世界上最好的文法分析器。柯林斯成功的关键在于将文法分析的每一个细节都研究得很仔细。柯林斯用的数学模型也很漂亮，整个工作可以用完美来形容。我曾因为研究的需要，找柯林斯要过他文法分析器的源程序，他很爽快地给了我。我试图将他的程序修改一下来满足我特定应用的要求，但后来发现，他的程序细节太多以至于很难进一步优化。<A href="http://scholar.google.com/scholar?q=Michael+Collins&amp;ie=UTF-8&amp;amp;amp;amp;amp;amp;oe=UTF-8&amp;hl=en&amp;btnG=Search" target=_blank>柯林斯的博士论文</A>堪称是自然语言处理领域的范文。它像一本优秀的小说，把所有事情的来龙去脉介绍的清清楚楚，对于任何有一点计算机和自然语言处理知识的人，都可以轻而易举地读懂他复杂的方法。<BR><BR>柯林斯毕业后，在 AT&amp;T 实验室度过了三年快乐的时光。在那里柯林斯完成了许多世界一流的研究工作诸如隐含马尔科夫模型的区别性训练方法，卷积核在自然语言处理中的应用等等。三年后，AT&amp;T 停止了自然语言处理方面的研究，柯林斯幸运地在 MIT 找到了教职。在 MIT 的短短几年间，柯林斯多次在国际会议上获得最佳论文奖。相比其他同行，这种成就是独一无二的。柯林斯的特点就是把事情做到极致。如果说有人喜欢“繁琐哲学”，柯林斯就是一个。<BR><BR><SPAN style="FONT-WEIGHT: bold"><BR>布莱尔：简单才美 </SPAN><BR><BR>在研究方法上，站在柯林斯对立面的典型是他的师兄艾里克 · 布莱尔 (<A href="http://www.cs.jhu.edu/%7Ebrill/" target=_blank>Eric Brill</A>) 和雅让斯基，后者我们已经介绍过了，这里就不再重复。与柯林斯从工业界到学术界相反，布莱尔职业路径是从学术界走到工业界。与柯里斯的研究方法相反，布莱尔总是试图寻找简单得不能再简单的方法。布莱尔的成名作是基于变换规则的机器学习方法 (transformation rule based machine learning)。这个方法名称虽然很复杂，其实非常简单。我们以拼音转换字为例来说明它：<BR><BR>第一步，我们把每个拼音对应的汉字中最常见的找出来作为第一遍变换的结果，当然结果有不少错误。比如，“常识”可能被转换成“长识”；<BR><BR>第二步，可以说是“去伪存真”，我们用计算机根据上下文，列举所有的同音字替换的规则，比如，如果 chang 被标识成“长”，但是后面的汉字是“识”，则将“长”改成“常”；<BR><BR>第三步，应该就是“去粗取精”，将所有的规则用到事先标识好的语料中，挑出有用的，删掉无用的。然后重复二三步，直到找不到有用的为止。<BR><BR>布莱尔就靠这么简单的方法，在很多自然语言研究领域，得到了几乎最好的结果。由于他的方法再简单不过了，许许多多的人都跟着学。布莱尔可以算是我在美国的第一个业师，我们俩就用这么简单的方法作词性标注 (part of speech tagging)，也就是把句子中的词标成名词动词，很多年内无人能超越。（最后超越我们的是后来加入 Google 的一名荷兰工程师，用的是同样的方法，但是做得细致很多）布莱尔离开学术界后去了微软研究院。在那里的第一年，他一人一年完成的工作比组里其他所有人许多年做的工作的总和还多。后来，布莱尔又加入了一个新的组，依然是高产科学家。据说，他的工作真正被微软重视要感谢 Google，因为有了 Google，微软才对他从人力物力上给于了巨大的支持，使得布莱尔成为微软搜索研究的领军人物之一。在研究方面，布莱尔有时不一定能马上找到应该怎么做，但是能马上否定掉一种不可能的方案。这和他追求简单的研究方法有关，他能在短时间内大致摸清每种方法的好坏。<BR><BR>由于布莱尔总是找简单有效的方法，而又从不隐瞒自己的方法，所以他总是很容易被包括作者我自己在内的很多人赶上和超过。好在布莱尔很喜欢别人追赶他，因为，当人们在一个研究方向超过他时，他已经调转船头驶向它方了。一次，艾里克对我说，有一件事我永远追不上他，那就是他比我先有了第二个孩子 ：）<BR><BR>在接下来了系列里，我们还会介绍一个繁与简结合的例子。<BR><BR><BR>本文出自:&nbsp;&nbsp;<A href="http://googlechinablog.com/2006/08/blog-post_115634657041368311.html"></A></div>]]></description>
	    <author><![CDATA[mjliao]]></author>
	    <comments>http://mjliao.blog.163.com/blog/static/37535193200783073821954</comments>
    <slash:comments>1</slash:comments>
    <guid isPermaLink="true">http://mjliao.blog.163.com/blog/static/37535193200783073821954</guid>
    <pubDate>Sun, 30 Sep 2007 07:38:21 +0800</pubDate>
    <dcterms:modified>2007-09-30T14:14:42+08:00</dcterms:modified>
  </item>    
  <item>
  	<title><![CDATA[数学之美 十四 谈谈数学模型的重要性]]></title>	
    <link>http://mjliao.blog.163.com/blog/static/3753519320078307385624</link>
    <description><![CDATA[<div><H3>
</H3><H3><A >数学之美 十四 谈谈数学模型的重要性</A></H3>
<P ><SPAN >2006年8月9日 上午 09:12:00</SPAN></P>


<DIV style="CLEAR: both"></DIV><FONT color=#666666><SPAN >发表者：吴军，Google 研究员 </SPAN><BR><BR></FONT>[注：一直关注数学之美系列的读者可能已经发现，我们对任何问题总是在找相应的准确的数学模型。为了说明模型的重要性，今年七月份我在 Google 中国内部讲课时用了整整一堂课来讲这个问题，下面的内容是我讲座的摘要。］<BR><BR>在包括哥白尼、伽利略和牛顿在内的所有天文学家中，我最佩服的是地心说的提出者托勒密。虽然天文学起源于古埃及，并且在古巴比伦时，人们就观测到了五大行星（金、木、水、火、土）运行的轨迹，以及行星在近日点运动比远日点快。（下图是在地球上看到的金星的轨迹，看过达芬奇密码的读者知道金星大约每四年在天上画一个五角星。）<BR><BR><IMG style="BORDER-RIGHT: 1px solid; BORDER-TOP: 1px solid; BORDER-LEFT: 1px solid; BORDER-BOTTOM: 1px solid" alt="" src="http://googlechinablog.com/uploaded_images/Picture2-758642.jpg" border=0><BR><BR>但是真正创立了天文学，并且计算出诸多天体运行轨迹的是两千年前古罗马时代的托勒密。虽然今天我们可能会嘲笑托勒密犯的简单的错误，但是真正了解托勒密贡献的人都会对他肃然起敬。托勒密发明了球坐标，定义了包括赤道和零度经线在内的经纬线，他提出了黄道，还发明了弧度制。<BR><BR>当然，他最大也是最有争议的发明是地心说。虽然我们知道地球是围绕太阳运动的，但是在当时，从人们的观测出发，很容易得到地球是宇宙中心的结论。从地球上看，行星的运动轨迹是不规则的，托勒密的伟大之处是用四十个小圆套大圆的方法，精确地计算出了所有行星运动的轨迹。（托勒密继承了毕达格拉斯的一些思想，他也认为圆是最完美的几何图形。）托勒密模型的精度之高，让以后所有的科学家惊叹不已。即使今天，我们在计算机的帮助下，也很难解出四十个套在一起的圆的方程。每每想到这里，我都由衷地佩服托勒密。一千五百年来，人们根据他的计算决定农时。但是，经过了一千五百年，托勒密对太阳运动的累积误差，还是差出了一星期。<BR><BR><IMG style="BORDER-RIGHT: 1px solid; BORDER-TOP: 1px solid; BORDER-LEFT: 1px solid; BORDER-BOTTOM: 1px solid" alt="" src="http://googlechinablog.com/uploaded_images/Picture1-710974.jpg" border=0><BR>地心说的示意图，我国天文学家张衡的浑天地动说其实就是地心说。<BR><BR>纠正地心说错误不是靠在托勒密四十个圆的模型上再多套上几个圆，而是进一步探索真理。哥白尼发现，如果以太阳为中心来描述星体的运行，只需要 8-10 个圆，就能计算出一个行星的运动轨迹，他提出了日心说。很遗憾的事，哥白尼正确的假设并没有得到比托勒密更好的结果，哥白尼的模型的误差比托勒密地要大不少。这是教会和当时人们认为哥白尼的学说是邪说的一个原因，所以日心说要想让人心服口服地接受，就得更准确地描述行星运动。<BR><BR>完成这一使命的是开普勒。开普勒在所有一流的天文学家中，资质较差，一生中犯了无数低级的错误。但是他有两条别人没有的东西，从他的老师第谷手中继承的大量的、在当时最精确的观测数据，以及运气。开普勒很幸运地发现了行星围绕太阳运转的轨道实际是椭圆形的，这样不需要用多个小圆套大圆，而只要用一个椭圆就能将星体运动规律描述清楚了。只是开普勒的知识和水平不足以解释为什么行星的轨道是椭圆形的。最后是伟大的科学家牛顿用万有引力解释了这个问题。<BR><BR>故事到这里似乎可以结束了。但是，许多年后，又有了个小的波澜。天文学家们发现，天王星的实际轨迹和用椭圆模型算出来的不太符合。当然，偷懒的办法是接着用小圆套大圆的方法修正，但是一些严肃的科学家在努力寻找真正的原因。英国的亚当斯和法国的维内尔（Verrier）独立地发现了吸引天王星偏离轨道的海王星。<BR><BR>讲座结束前，我和 Google 中国的工程师们一同总结了这么几个结论：<BR>１.　一个正确的数学模型应当在形式上是简单的。（托勒密的模型显然太复杂。）<BR>２.　一个正确的模型在它开始的时候可能还不如一个精雕细琢过的错误的模型来的准确，但是，如果我们认定大方向是对的，就应该坚持下去。（日心说开始并没有地心说准确。）<BR>３.　大量准确的数据对研发很重要。<BR>４.　正确的模型也可能受噪音干扰，而显得不准确；这时我们不应该用一种凑合的修正方法来弥补它，而是要找到噪音的根源，这也许能通往重大发现。<BR><BR>在网络搜索的研发中，我们在前面提到的单文本词频/逆文本频率指数（TF/IDF) 和网页排名（page rank)都相当于是网络搜索中的“椭圆模型”，它们都很简单易懂。</H3></div>]]></description>
	    <author><![CDATA[mjliao]]></author>
	    <comments>http://mjliao.blog.163.com/blog/static/3753519320078307385624</comments>
    <slash:comments>0</slash:comments>
    <guid isPermaLink="true">http://mjliao.blog.163.com/blog/static/3753519320078307385624</guid>
    <pubDate>Sun, 30 Sep 2007 07:38:05 +0800</pubDate>
    <dcterms:modified>2007-09-30T07:38:05+08:00</dcterms:modified>
  </item>    
  <item>
  	<title><![CDATA[数学之美 系列十三 信息指纹及其应用]]></title>	
    <link>http://mjliao.blog.163.com/blog/static/3753519320078307370155</link>
    <description><![CDATA[<div><H3><A >数学之美 系列十三 信息指纹及其应用</A></H3>
<P ><SPAN >2006年8月3日 上午 11:17:00</SPAN></P>


<DIV style="CLEAR: both"></DIV><FONT color=#666666><SPAN >发表者：吴军，Google 研究员 </SPAN><BR><BR></FONT>任何一段信息文字，都可以对应一个不太长的随机数，作为区别它和其它信息的指纹（Fingerprint)。只要算法设计的好，任何两段信息的指纹都很难重复，就如同人类的指纹一样。信息指纹在加密、信息压缩和处理中有着广泛的应用。<BR><BR>我们在<A href="http://googlechinablog.com/2006/05/web-crawlers.html" target=_blank>图论和网络爬虫</A>一文中提到，为了防止重复下载同一个网页，我们需要在哈希表中纪录已经访问过的网址（URL)。但是在哈希表中以字符串的形式直接存储网址，既费内存空间，又浪费查找时间。现在的网址一般都较长，比如，如果在 Google 或者百度在查找数学之美，对应的网址长度在一百个字符以上。下面是百度的链接<BR><A href="http://www.baidu.com/s?ie=gb2312&amp;bs=%CA%FD%D1%A7%D6%AE%C3%C0&amp;sr=&amp;z=&amp;cl=3&amp;f=8"><BR>http://www.baidu.com/s?ie=gb2312&amp;bs=%CA%FD%D1%A7%D6%AE%C3%C0&amp;sr=&amp;amp;z=&amp;cl=3&amp;f=8<BR>&amp;wd=%CE%E2%BE%FC+%CA%FD%D1%A7%D6%AE%C3%C0&amp;ct=0</A><BR><BR>假定网址的平均长度为一百个字符，那么存贮 200 亿个网址本身至少需要 2 TB，即两千 GB 的容量，考虑到哈希表的存储效率一般只有 50%，实际需要的内存在 4 TB以上。即使把这些网址放到了计算机的内存中，由于网址长度不固定，以字符串的形式查找的效率会很低。因此，我们如果能够找到一个函数，将这 200 亿个网址随机地映射到128 二进位即 16 个字节的整数空间，比如将上面那个很长的字符串对应成一个如下的随机数:<BR><BR>893249432984398432980545454543<BR><BR>这样每个网址只需要占用 16 个字节而不是原来的一百个。这就能把存储网址的内存需求量降低到原来的 1/6。这个16 个字节的随机数，就称做该网址的信息指纹（Fingerprint)。可以证明，只要产生随机数的算法足够好，可以保证几乎不可能有两个字符串的指纹相同，就如同不可能有两个人的指纹相同一样。由于指纹是固定的 128 位整数，因此查找的计算量比字符串比较小得多。网络爬虫在下载网页时，它将访问过的网页的网址都变成一个个信息指纹，存到哈希表中，每当遇到一个新网址时，计算机就计算出它的指纹，然后比较该指纹是否已经在哈希表中，来决定是否下载这个网页。这种整数的查找比原来字符串查找,可以快几倍到几十倍。<BR><BR>产生信息指纹的关键算法是伪随机数产生器算法（prng)。最早的 prng 算法是由计算机之父冯诺伊曼提出来的。他的办法非常简单，就是将一个数的平方掐头去尾，取中间的几位数。比如一个四位的二进制数 1001（相当于十进制的9），其平方为 01010001 (十进制的 81）掐头去尾剩下中间的四位 0100。当然这种方法产生的数字并不很随机，也就是说两个不同信息很有可能有同一指纹。现在常用的 MersenneTwister 算法要好得多。<BR><BR>信息指纹的用途远不止网址的消重，信息指纹的的孪生兄弟是密码。信息指纹的一个特征是其不可逆性, 也就是说,<BR>无法根据信息指纹推出原有信息，这种性质， 正是网络加密传输所需要的。比如说，一个网站可以根据用户的Cookie 识别不同用户，这个 cookie 就是信息指纹。但是网站无法根据信息指纹了解用户的身份，这样就可以保护用户的隐私。在互联网上，加密的可靠性，取决于是否很难人为地找到拥有同一指纹的信息， 比如一个黑客是否能随意产生用户的 cookie。从加密的角度讲 MersenneTwister，算法并不好，因为它产生的随机数有相关性。<BR><BR>互联网上加密要用基于加密伪随机数产生器（csprng)。常用的算法有 MD5 或者 SHA1 等标准，它们可以将不定长的信息变成定长的 128 二进位或者 160 二进位随机数。值得一提的事，SHA1 以前被认为是没有漏洞的，现在已经被中国的王小云教授证明存在漏洞。但是大家不必恐慌， 因为这和黑客能真正攻破你的注册信息是还两回事。<BR><BR>信息指纹的虽然历史很悠久，但真正的广泛应用是在有了互联网以后，这几年才渐渐热门起来。</div>]]></description>
	    <author><![CDATA[mjliao]]></author>
	    <comments>http://mjliao.blog.163.com/blog/static/3753519320078307370155</comments>
    <slash:comments>0</slash:comments>
    <guid isPermaLink="true">http://mjliao.blog.163.com/blog/static/3753519320078307370155</guid>
    <pubDate>Sun, 30 Sep 2007 07:37:00 +0800</pubDate>
    <dcterms:modified>2007-09-30T07:37:00+08:00</dcterms:modified>
  </item>    
  <item>
  	<title><![CDATA[数学之美 系列 12 - 余弦定理和新闻的分类]]></title>	
    <link>http://mjliao.blog.163.com/blog/static/37535193200783073613532</link>
    <description><![CDATA[<div><H3><A >数学之美 系列 12 - 余弦定理和新闻的分类</A></H3>
<P ><SPAN >2006年7月20日 上午 10:12:00</SPAN></P>


<DIV style="CLEAR: both"></DIV><FONT color=#666666><SPAN >发表者：吴军，Google 研究员 </SPAN><BR><BR></FONT>余弦定理和新闻的分类似乎是两件八杆子打不着的事，但是它们确有紧密的联系。具体说，新闻的分类很大程度上依靠余弦定理。<BR><BR>Google 的新闻是自动分类和整理的。所谓新闻的分类无非是要把相似的新闻放到一类中。计算机其实读不懂新闻，它只能快速计算。这就要求我们设计一个算法来算出任意两篇新闻的相似性。为了做到这一点，我们需要想办法用一组数字来描述一篇新闻。<BR><BR>我们来看看怎样找一组数字，或者说一个向量来描述一篇新闻。回忆一下我们在“<A href="http://googlechinablog.com/2006/06/blog-post_27.html" target=_blank>如何度量网页相关性</A>”一文中介绍的TF/IDF 的概念。对于一篇新闻中的所有实词，我们可以计算出它们的单文本词汇频率/逆文本频率值（TF/IDF)。不难想象，和新闻主题有关的那些实词频率高，TF/IDF 值很大。我们按照这些实词在词汇表的位置对它们的 TF/IDF 值排序。比如，词汇表有六万四千个词，分别为<BR><BR>单词编号 汉字词<BR>------------------<BR>1 阿<BR>2 啊<BR>3 阿斗<BR>4 阿姨<BR>...<BR>789 服装<BR>....<BR>64000 做作<BR><BR>在一篇新闻中，这 64,000 个词的 TF/IDF 值分别为<BR><BR>单词编号 TF/IDF 值<BR>==============<BR>1 0<BR>2 0.0034<BR>3 0<BR>4 0.00052<BR>5 0<BR>...<BR>789 0.034<BR>...<BR>64000 0.075<BR><BR><BR>如果单词表中的某个次在新闻中没有出现，对应的值为零，那么这 64,000 个数，组成一个64,000维的向量。我们就用这个向量来代表这篇新闻，并成为新闻的特征向量。如果两篇新闻的特征向量相近，则对应的新闻内容相似，它们应当归在一类，反之亦然。<BR><BR>学过向量代数的人都知道，向量实际上是多维空间中有方向的线段。如果两个向量的方向一致，即夹角接近零，那么这两个向量就相近。而要确定两个向量方向是否一致，这就要用到余弦定理计算向量的夹角了。<BR><BR>余弦定理对我们每个人都不陌生，它描述了三角形中任何一个夹角和三个边的关系，换句话说，给定三角形的三条边，我们可以用余弦定理求出三角形各个角的角度。假定三角形的三条边为 a, b 和 c，对应的三个角为 A, B 和 C，那么角 A 的余弦 --<BR><BR><IMG style="BORDER-RIGHT: 1px solid; BORDER-TOP: 1px solid; BORDER-LEFT: 1px solid; BORDER-BOTTOM: 1px solid" alt="" src="http://googlechinablog.com/uploaded_images/2c4eacd0e4ee4aeb29f0833be0a0442e-771570.png" border=0><BR><BR>如果我们将三角形的两边 b 和 c 看成是两个向量，那么上述公式等价于<BR><BR><IMG style="BORDER-RIGHT: 1px solid; BORDER-TOP: 1px solid; BORDER-LEFT: 1px solid; BORDER-BOTTOM: 1px solid" alt="" src="http://googlechinablog.com/uploaded_images/cosine-a-744082.png" border=0><BR><BR>其中分母表示两个向量 b 和 c 的长度，分子表示两个向量的内积。举一个具体的例子，假如新闻 X 和新闻 Y 对应向量分别是<BR>x1,x2,...,x64000 和<BR>y1,y2,...,y64000,<BR>那么它们夹角的余弦等于，<BR><BR><IMG style="BORDER-RIGHT: 1px solid; BORDER-TOP: 1px solid; BORDER-LEFT: 1px solid; BORDER-BOTTOM: 1px solid" alt="" src="http://googlechinablog.com/uploaded_images/cos_theta-757119.JPG" border=0><BR><BR>当两条新闻向量夹角的余弦等于一时，这两条新闻完全重复（用这个办法可以删除重复的网页）；当夹角的余弦接近于一时，两条新闻相似，从而可以归成一类；夹角的余弦越小，两条新闻越不相关。<BR><BR><IMG style="BORDER-RIGHT: 1px solid; BORDER-TOP: 1px solid; BORDER-LEFT: 1px solid; BORDER-BOTTOM: 1px solid" alt="" src="http://googlechinablog.com/uploaded_images/news-798354.jpg" border=0><BR><BR>我们在中学学习余弦定理时，恐怕很难想象它可以用来对新闻进行分类。在这里，我们再一次看到数学工具的用途。</div>]]></description>
	    <author><![CDATA[mjliao]]></author>
	    <comments>http://mjliao.blog.163.com/blog/static/37535193200783073613532</comments>
    <slash:comments>1</slash:comments>
    <guid isPermaLink="true">http://mjliao.blog.163.com/blog/static/37535193200783073613532</guid>
    <pubDate>Sun, 30 Sep 2007 07:36:13 +0800</pubDate>
    <dcterms:modified>2007-09-30T07:36:13+08:00</dcterms:modified>
  </item>    
  <item>
  	<title><![CDATA[数学之美 系列十一 - Google 阿卡 47 的制造者阿米特.辛格博士]]></title>	
    <link>http://mjliao.blog.163.com/blog/static/3753519320078307353376</link>
    <description><![CDATA[<div><H3><A>数学之美 系列十一 - Google 阿卡 47 的制造者阿米特.辛格博士</A></H3>
<P><SPAN>2006年7月10日 上午 09:52:00</SPAN></P>
<DIV style="CLEAR: both"></DIV><SPAN>发表者：Google 研究员，吴军 </SPAN><BR><BR>枪迷或者看过尼古拉斯.凯奇（Nicolas Cage)主演的电影“战争之王”（Lord of<BR>War)的人也许还记得影片开头的一段话：（在所有轻武器中，）最有名的是阿卡 47( AK47)冲锋枪(也就是中国的五六式冲锋枪的原型），因为它从不卡壳、从不损坏、可在任何环境下使用、可靠性好、杀伤力大并且操作简单。<BR><BR>我认为，在计算机中一个好的算法，应该向阿卡 47 冲锋枪那样简单、有效、可靠性好而且容易读懂(或者说易操作），而不应该是故弄玄虚。Google 的杰出工程师阿米特.辛格博士 (Amit Singhal) 就是为 Google 设计阿卡 47 冲锋枪的人，在公司内部，Google 的排序算法便是以他的名字命名的。<BR><BR>从加入 Google 的第一天，我就开始了和辛格长期而愉快的合作，而他一直是我的一个良师益友。辛格、Matt Cutts（中国一些用户误认为他是联邦调查局特工，当然他不是）、马丁和我四个人当时一同研究和解决网络搜索中的作弊问题（Spam)。我们需要建一个分类器，我以前一直在学术界工作和学习，比较倾向找一个很漂亮的解决方案。我设计了一个很完美的分类器，大约要花三个月到半年时间来实现和训练，而辛格认为找个简单有效的办法就行了。我们于是尽可能简化问题，一、两个月就把作弊的数量减少了一半。当时我们和公司工程副总裁罗森打了个赌，如果我们能减少 40% 的作弊，他就送我们四个家庭去夏威夷度假，后来罗森真的履约了。这个分类器设计得非常小巧（只用很小的内存），而且非常快速（几台服务器就能处理全球搜索的分类），至今运行得很好。<BR><BR>后来我和辛格一起又完成了许多项目，包括对中、日、韩文排名算法的改进。每一次，辛格总是坚持找简单有效的解决方案。这种做法在 Google 这个人才济济的公司常常招人反对，因为很多资深的工程师怀疑这些简单方法的有效性。不少人试图用精确而复杂的办法对辛格的设计的各种“阿卡47” 进行改进，后来发现几乎所有时候，辛格的简单方法都接近最优化的解决方案，而且还快得多。另一条选择简单方案的原因是这样设计的系统很容易查错（debug)。<BR><BR>当然，辛格之所以总是能找到那些简单有效的方法，不是靠直觉，更不是撞大运，而是靠他丰富的研究经验。辛格早年从师于搜索大师萨尔顿(Salton)教授，毕业后就职于 AT&amp;T 实验室。在那里，他和两个同事半年就搭起了一个中等规模的搜索引擎，这个引擎索引的网页数量虽然无法和商用的引擎相比，但是准确性却非常好。在 AT&amp;T，他对搜索问题的各个细节进行了仔细的研究，他的那些简单而有效的解决方案，常常是深思熟虑去伪存真的结果。<BR><BR>辛格非常鼓励年轻人不怕失败，大胆尝试。一次一位刚毕业不久的工程师因为把带有错误的程序推出到 Google 的服务器上而惶惶不可终日。辛格安慰她讲，你知道，我在 Google 犯的最大一次错误是曾经将所有网页的相关性得分全部变成了零，于是所有搜索的结果全部是随机的了。这位工程师后来为 Google 开发了很多好的产品。<BR><BR>辛格在 AT&amp;T 时确立了他在学术界的地位，但是，他不是一个满足于做实验写论文的人，于是他离开了实验室来到了当时只有百、十人的 Google。在这里，他得以施展才智，重写了 Google 的排名算法，并且一直在负责改进它。辛格因为舍不得放下两个孩子，很少参加各种会议，但是他仍然被学术界公认为是当今最权威的网络搜索专家。2005年，辛格作为杰出校友被请回母校康乃尔大学计算机系在 40 年系庆上作报告，获得这一殊荣的还有大名鼎鼎的美国工程院院士，计算机独立磁盘冗余阵列（RAID)的发明人凯茨(Randy Katz) 教授。<BR><BR><BR>本文出自:&nbsp;&nbsp;<A href="http://googlechinablog.com/2006/07/google-47.html"></A></div>]]></description>
	    <author><![CDATA[mjliao]]></author>
	    <comments>http://mjliao.blog.163.com/blog/static/3753519320078307353376</comments>
    <slash:comments>0</slash:comments>
    <guid isPermaLink="true">http://mjliao.blog.163.com/blog/static/3753519320078307353376</guid>
    <pubDate>Sun, 30 Sep 2007 07:35:33 +0800</pubDate>
    <dcterms:modified>2007-09-30T14:15:21+08:00</dcterms:modified>
  </item>    
  <item>
  	<title><![CDATA[数学之美 系列十 有限状态机和地址识别]]></title>	
    <link>http://mjliao.blog.163.com/blog/static/37535193200783073516709</link>
    <description><![CDATA[<div><H3><A >数学之美 系列十 有限状态机和地址识别</A></H3>
<P ><SPAN >2006年7月5日 上午 09:09:00</SPAN></P>


<DIV style="CLEAR: both"></DIV><FONT color=#666666><SPAN >发表者：吴军，Google 研究员 </SPAN><BR><BR></FONT>地址的识别和分析是本地搜索必不可少的技术，尽管有许多识别和分析地址的方法，最有效的是有限状态机。<BR><BR>一个有限状态机是一个特殊的有向图（参见有关<A href="http://googlechinablog.com/2006/05/web-crawlers.html" target=_blank>图论的系列</A>），它包括一些状态（节点）和连接这些状态的有向弧。下图是一个识别中国地址的有限状态机的简单的例子。<BR><BR><IMG style="BORDER-RIGHT: 1px solid; BORDER-TOP: 1px solid; BORDER-LEFT: 1px solid; BORDER-BOTTOM: 1px solid" alt="" src="http://googlechinablog.com/uploaded_images/local-706721.jpg" border=0><BR><BR>每一个有限状态机都有一个启始状态和一个终止状态和若干中间状态。每一条弧上带有从一个状态进入下一个状态的条件。比如，在上图中，当前的状态是“省”，如果遇到一个词组和（区）县名有关，我们就进入状态“区县”；如果遇到的下一个词组和城市有关，那么我们就进入“市”的状态，如此等等。如果一条地址能从状态机的起始状态经过状态机的若干中间状态，走到终止状态，那么这条地址则有效，否则无效。比如说，“北京市双清路83号”对于上面的有限状态来讲有效，而“上海市辽宁省马家庄”则无效（因为无法从市走回到省）。<BR><BR>使用有限状态机识别地址，关键要解决两个问题，即通过一些有效的地址建立状态机，以及给定一个有限状态机后，地址字串的匹配算法。好在这两个问题都有现成的算法。有了关于地址的有限状态机后，我们就可又用它分析网页，找出网页中的地址部分，建立本地搜索的数据库。同样，我们也可以对用户输入的查询进行分析，挑出其中描述地址的部分，当然，剩下的关键词就是用户要找的内容。比如，对于用户输入的“北京市双清路附近的酒家”，Google 本地会自动识别出地址“北京市双清路”和要找的对象“酒家”。<BR><BR>上述基于有限状态机的地址识别方法在实用中会有一些问题：当用户输入的地址不太标准或者有错别字时，有限状态机会束手无策，因为它只能进行严格匹配。（其实，有限状态机在计算机科学中早期的成功应用是在程序语言编译器的设计中。一个能运行的程序在语法上必须是没有错的，所以不需要模糊匹配。而自然语言则很随意，无法用简单的语法描述。）<BR><BR>为了解决这个问题，我们希望有一个能进行模糊匹配、并给出一个字串为正确地址的可能性。为了实现这一目的，科学家们提出了基于概率的有限状态机。这种基于概率的有限状态机和离散的马尔可夫链（详见前面关于<A href="http://googlechinablog.com/2006/04/blog-post_17.html" target=_blank>马尔可夫模型</A>的系列）基本上等效。<BR><BR>在八十年代以前，尽管有不少人使用基于概率的有限状态机，但都是为自己的应用设计专用的有限状态机的程序。九十年代以后，随着有限状态机在自然语言处理的广泛应用，不少科学家致力于编写通用的有限状态机程序库。其中，最成功的是前 AT&amp;T 实验室的三位科学家，莫瑞（Mohri）, 皮瑞尔（Pereira） 和瑞利（Riley）。他们三人花了很多年时间，编写成一个通用的基于概率的有限状态机 C 语言工具库。由于 AT&amp;T 有对学术界免费提供各种编程工具的好传统，他们三人也把自己多年的心血拿出来和同行们共享。可惜好景不长，AT&amp;T 实验室风光不再，这三个人都离开了 AT&amp;T，莫瑞成了纽约大学的教授，皮瑞尔当了宾西法尼亚大学计算机系系主任，而瑞利成了 Google 的研究员，AT&amp;T 实验室的新东家不再免费提供有限状态机 C 语言工具库。虽然此前莫瑞等人公布了他们的详细算法，但是省略了实现的细节。因此在学术界，不少科学家能够重写同样功能的工具库，但是很难达到 AT&amp;T 工具库的效率（即运算速度），这的确是一件令人遗憾的事。</div>]]></description>
	    <author><![CDATA[mjliao]]></author>
	    <comments>http://mjliao.blog.163.com/blog/static/37535193200783073516709</comments>
    <slash:comments>0</slash:comments>
    <guid isPermaLink="true">http://mjliao.blog.163.com/blog/static/37535193200783073516709</guid>
    <pubDate>Sun, 30 Sep 2007 07:35:16 +0800</pubDate>
    <dcterms:modified>2007-09-30T07:35:16+08:00</dcterms:modified>
  </item>    
  <item>
  	<title><![CDATA[数学之美 系列九 -- 如何确定网页和查询的相关性]]></title>	
    <link>http://mjliao.blog.163.com/blog/static/37535193200783073434540</link>
    <description><![CDATA[<div><H3><A>学之美 系列九 -- 如何确定网页和查询的相关性</A></H3>
<P><SPAN>2006年6月27日 上午 09:53:00</SPAN></P>
<DIV style="CLEAR: both"></DIV><SPAN>发表者：吴军，Google 研究员 </SPAN><BR><BR>[我们已经谈过了<A href="http://googlechinablog.com/2006/05/web-crawlers.html" target=_blank>如何自动下载网页</A>、<A href="http://googlechinablog.com/2006/05/blog-post_10.html" target=_blank>如何建立索引</A>、<A href="http://googlechinablog.com/2006/02/page-rank-google.html" target=_blank>如何衡量网页的质量</A>(Page Rank)。我们今天谈谈如何确定一个网页和某个查询的相关性。了解了这四个方面，一个有一定编程基础的读者应该可以写一个简单的搜索引擎了，比如为您所在的学校或院系建立一个小的搜索引擎。]<BR><BR>我们还是看上回的例子，查找关于“原子能的应用”的网页。我们第一步是在索引中找到包含这三个词的网页（详见关于<A href="http://googlechinablog.com/2006/05/blog-post_10.html" target=_blank>布尔运算</A>的系列）。现在任何一个搜索引擎都包含几十万甚至是上百万个多少有点关系的网页。那么哪个应该排在前面呢？显然我们应该根据网页和查询“原子能的应用”的相关性对这些网页进行排序。因此，这里的关键问题是如何度量网页和查询的相关性。<BR><BR>我们知道，短语“原子能的应用”可以分成三个关键词：原子能、的、应用。根据我们的直觉，我们知道，包含这三个词多的网页应该比包含它们少的网页相关。当然，这个办法有一个明显的漏洞，就是长的网页比短的网页占便宜，因为长的网页总的来讲包含的关键词要多些。因此我们需要根据网页的长度，对关键词的次数进行归一化，也就是用关键词的次数除以网页的总字数。我们把这个商称为“关键词的频率”，或者“单文本词汇频率”（Term Frequency)，比如，在某个一共有一千词的网页中“原子能”、“的”和“应用”分别出现了 2 次、35 次 和 5 次，那么它们的词频就分别是 0.002、0.035 和 0.005。 我们将这三个数相加，其和 0.042 就是相应网页和查询“原子能的应用”<BR>相关性的一个简单的度量。概括地讲，如果一个查询包含关键词 w1,w2,...,wN, 它们在一篇特定网页中的词频分别是: TF1, TF2, ..., TFN。 （TF: term frequency)。 那么，这个查询和该网页的相关性就是:<BR>TF1 + TF2 + ... + TFN。<BR><BR>读者可能已经发现了又一个漏洞。在上面的例子中，词“的”站了总词频的 80% 以上，而它对确定网页的主题几乎没有用。我们称这种词叫“应删除词”（Stopwords)，也就是说在度量相关性是不应考虑它们的频率。在汉语中，应删除词还有“是”、“和”、“中”、“地”、“得”等等几十个。忽略这些应删除词后，上述网页的相似度就变成了0.007，其中“原子能”贡献了0.002，“应用”贡献了 0.005。<BR><BR>细心的读者可能还会发现另一个小的漏洞。在汉语中，“应用”是个很通用的词，而“原子能”是个很专业的词，后者在相关性排名中比前者重要。因此我们需要给汉语中的每一个词给一个权重，这个权重的设定必须满足下面两个条件：<BR><BR>1. 一个词预测主题能力越强，权重就越大，反之，权重就越小。我们在网页中看到“原子能”这个词，或多或少地能了解网页的主题。我们看到“应用”一次，对主题基本上还是一无所知。因此，“原子能“的权重就应该比应用大。<BR><BR>2. 应删除词的权重应该是零。<BR><BR>我们很容易发现，如果一个关键词只在很少的网页中出现，我们通过它就容易锁定搜索目标，它的权重也就应该大。反之如果一个词在大量网页中出现，我们看到它仍然不很清楚要找什么内容，因此它应该小。概括地讲，假定一个关键词 ｗ 在 Ｄｗ 个网页中出现过，那么 Ｄｗ 越大，ｗ 的权重越小，反之亦然。在信息检索中，使用最多的权重是“逆文本频率指数” （Inverse document frequency 缩写为ＩＤＦ），它的公式为ｌｏｇ（Ｄ／Ｄｗ）其中Ｄ是全部网页数。比如，我们假定中文网页数是Ｄ＝１０亿，应删除词“的”在所有的网页中都出现，即Ｄｗ＝１０亿，那么它的ＩＤＦ＝log(10亿/10亿）= log (1) = ０。假如专用词“原子能”在两百万个网页中出现，即Ｄｗ＝２００万，则它的权重ＩＤＦ＝log(500) =6.2。又假定通用词“应用”，出现在五亿个网页中，它的权重ＩＤＦ = log(2)<BR>则只有 0.7。也就只说，在网页中找到一个“原子能”的比配相当于找到九个“应用”的匹配。利用 IDF，上述相关性计算个公式就由词频的简单求和变成了加权求和，即 TF1*IDF1 +　TF2*IDF2 ＋... + TFN*IDFN。在上面的例子中，该网页和“原子能的应用”的相关性为 0.0161，其中“原子能”贡献了 0.0126，而“应用”只贡献了0.0035。这个比例和我们的直觉比较一致了。<BR><BR>ＴＦ／ＩＤＦ（term frequency/inverse document frequency) 的概念被公认为信息检索中最重要的发明。在搜索、文献分类和其他相关领域有广泛的应用。讲起 TF/IDF 的历史蛮有意思。IDF 的概念最早是剑桥大学的斯巴克－琼斯[注：她有两个姓］ (Karen Sparck Jones)提出来的。斯巴克－琼斯 １９７２ 年在一篇题为关键词特殊性的统计解释和她在文献检索中的应用的论文中提出ＩＤＦ。遗憾的是，她既没有从理论上解释为什么权重ＩＤＦ 应该是对数函数 ｌｏｇ（Ｄ／Ｄｗ）（而不是其它的函数，比如平方根），也没有在这个题目上作进一步深入研究，以至于在以后的很多文献中人们提到 ＴＦ／ＩＤＦ 时没有引用她的论文，绝大多数人甚至不知道斯巴克－琼斯的贡献。同年罗宾逊写了个两页纸的解释，解释得很不好。倒是后来康乃尔大学的萨尔顿（Salton)多次写文章、写书讨论 TF/IDF 在信息检索中的用途，加上萨尔顿本人的大名（信息检索的世界大奖就是以萨尔顿的名字命名的）。很多人都引用萨尔顿的书，甚至以为这个信息检索中最重要的概念是他提出的。当然，世界并没有忘记斯巴克－琼斯的贡献，2004年，在纪念文献学学报创刊 60 周年之际，该学报重印了斯巴克-琼斯的大作。罗宾逊在同期期刊上写了篇文章，用香农的信息论解释 IDF，这回的解释是对的，但文章写的并不好、非常冗长（足足十八页），把一个简单问题搞复杂了。其实，信息论的学者们已经发现并指出，其实 IDF 的概念就是一个特定条件下、关键词的概率分布的交叉熵（Kullback-Leibler Divergence)（详见<A href="http://googlechinablog.com/2006/04/4.html" target=_blank>上一系列</A>）。这样，信息检索相关性的度量，又回到了信息论。<BR><BR>现在的搜索引擎对 TF/IDF 进行了不少细微的优化，使得相关性的度量更加准确了。当然，对有兴趣写一个搜索引擎的爱好者来讲，使用 TF/IDF 就足够了。 如果我们结合上网页排名(Page Rank)，那么给定一个查询，有关网页综合排名大致由相关性和网页排名乘积决定。<BR><BR><BR>本文出自:&nbsp;&nbsp;<A href="http://googlechinablog.com/2006/06/blog-post_27.html"></A></div>]]></description>
	    <author><![CDATA[mjliao]]></author>
	    <comments>http://mjliao.blog.163.com/blog/static/37535193200783073434540</comments>
    <slash:comments>0</slash:comments>
    <guid isPermaLink="true">http://mjliao.blog.163.com/blog/static/37535193200783073434540</guid>
    <pubDate>Sun, 30 Sep 2007 07:34:34 +0800</pubDate>
    <dcterms:modified>2007-10-01T20:06:24+08:00</dcterms:modified>
  </item>    
  <item>
  	<title><![CDATA[数学之美 系列八-- 贾里尼克的故事和现代语言处理]]></title>	
    <link>http://mjliao.blog.163.com/blog/static/37535193200783073257992</link>
    <description><![CDATA[<div><H3><A>数学之美 系列八-- 贾里尼克的故事和现代语言处理</A></H3>
<P><SPAN>2006年6月8日 上午 09:15:00</SPAN></P>
<DIV style="CLEAR: both"></DIV><SPAN>发表者：Google 研究员，吴军 </SPAN><BR><BR>读者也许注意到了，我们在前面的系列中多次提到了贾里尼克这个名字。事实上，现代语音识别和自然语言处理确实是和它的名字是紧密联系在一起的。我想在这回的系列里，介绍贾里尼克本人。在这里我不想列举他的贡献，而想讲一讲他作为一个普普通通的人的故事。这些事要么是我亲身经历的，要么是他亲口对我讲的。<BR><BR>弗莱德里克.贾里尼克(Fred Jelinek)出生于捷克一个富有的犹太家庭。他的父母原本打算送他去英国的公学（私立学校）读书。为了教他德语，还专门请的一位德国的家庭女教师，但是第二次世界大战完全打碎了他们的梦想。他们先是被从家中赶了出去，流浪到布拉格。他的父亲死在了集中营，弗莱德自己成天在街上玩耍，完全荒废了学业。二战后，当他再度回到学校时，他的成绩一塌糊涂， 全部是 D，但是很快他就赶上了班上的同学。不过，他在小学时从来没有得过 A。1949年，他的母亲带领全家移民美国。在美国，贾里尼克一家生活非常贫困，全家基本是靠母亲做点心卖钱为生，弗莱德自己十四五岁就进工厂打工补助全家。 <BR><BR>贾里尼克最初想成为一个律师，为他父亲那样的冤屈者辩护，但他很快意识到他那浓厚的外国口音将使他在法庭上的辩护很吃力。贾里尼克的第二个理想是成为医生，他想进哈佛大学医学院，但经济上他无法承担医学院 8 年高昂的学费。与此同时麻省理工学院给于了他一份（为东欧移民设的）全额奖学金。贾里尼克决定到麻省理工学电机工程。在那里，他遇到了信息论的鼻祖香农博士，和语言学大师贾格布森 <A href="http://www.mnsu.edu/emuseum/information/biography/fghij/jakobson_roman.html" target=_blank>Roman Jakobson</A> (他提出了著名的通信六功能）[注释一]，后来贾里尼克又陪着太太听最伟大的语言学家乔姆斯基(Noam Chomsky)的课。这三位大师对贾里尼克今后的研究方向--利用信息论解决语言问题产生的重要影响。<BR><BR>贾里尼克从麻省理工获得博士学位后，在哈佛大学教了一年书，然后到康乃尔大学任教。他之所以选择康乃尔大学，是因为找工作时和那里的一位语言学家谈得颇为投机。当时那位教授表示愿意和贾里尼克在利用信息论解决语言问题上合作。但是，等贾里尼克到康乃尔以后，那位教授表示对语言学在没有兴趣而转向写歌剧了。贾里尼克对语言学家的坏印象从此开始。加上后来他在 IBM 时发现语言学家们嘴上头头是道，干起活来高不成低不就，对语言学家从此深恶痛绝。他甚至说："我每开除一名语言学家，我的语音识别系统错误率就降低一个百分点。" 这句话后来在业界广为流传，为每一个搞语音识别和语言处理的人所熟知。<BR><BR>贾里尼克在康乃尔十年磨一剑，潜心研究信息论，终于悟出了自然语言处理的真谛。１９７２年，贾里尼克到ＩＢＭ 华生实验室（ＩＢＭ　Ｔ．Ｇ．Ｗａｔｓｏｎ　Ｌａｂｓ）做学术休假，无意中领导了语音识别实验室，两年后他在康乃尔和ＩＢＭ 之间选择了留在ＩＢＭ。在那里，贾里尼克组建了阵容空前绝后强大的研究队伍，其中包括他的著名搭档波尔（Bahl），著名的语音识别 Dragon 公司的创始人贝克夫妇，解决最大熵迭代算法的达拉皮垂(Della Pietra)孪生兄弟，BCJR 算法的另外两个共同提出者库克(Cocke)和拉维夫(Raviv)，以及第一个提出机器翻译统计模型的布朗。 <BR><BR>七十年代的 IBM 有点像九十年代的微软和今天的 Google, 给于杰出科学家作任何有兴趣研究的自由。在那种宽松的环境里，贾里尼克等人提出了统计语音识别的框架结构。 在贾里尼克以前，科学家们把语音识别问题当作人工智能问题和模式匹配问题。而贾里尼克把它当成通信问题，并用两个隐含马尔可夫模型（声学模型和语言模型）把语音识别概括得清清楚楚。这个框架结构对至今的语音和语言处理有着深远的影响，它从根本上使得语音识别有实用的可能。 贾里尼克本人后来也因此当选美国工程院院士。<BR><BR>贾里尼克和波尔，库克以及拉维夫对人类的另一大贡献是 BCJR 算法，这是今天数字通信中应用的最广的两个算法之一（另一个是维特比算法）。有趣的是，这个算法发明了二十年后，才得以广泛应用。IBM 于是把它列为了 IBM 有史以来对人类最大贡献之一，并贴在加州 Amaden 实现室墙上。遗憾的是 BCJR 四个人已经全部离开 IBM，有一次IBM 的通信部门需要用这个算法，还得从斯坦福大学请一位专家去讲解，这位专家看到 IBM 橱窗里的成就榜，感慨万分。 <BR><BR>贾里尼克和 IBM 一批最杰出的科学家在九十年代初离开了 IBM，他们大多数在华尔街取得了巨大的成功。贾里尼克的书生气很浓，于是去约翰霍普金斯大学建立了世界著名的 CLSP 实验室。每年夏天，贾里尼克邀请世界上 20-30 名顶级的科学家和学生到 CLSP 一起工作，使得 CLSP 成为世界上语音和语言处理的中心之一。 <BR><BR>贾里尼克治学极为严谨，对学生要求也极严。他淘汰学生的比例极高，即使留下来的，毕业时间也极长。但是，另一方面，贾里尼克也千方百计利用自己的影响力为学生的学习和事业创造方便。贾里尼克为组里的每一位学生提供从进组第一天到离开组最后一天全部的学费和生活费。他还为每一位学生联系实习机会，并保证每位学生在博士生阶段至少在大公司实习一次。从他那里拿到博士学位的学生，全部任职于著名实验室，比如IBM, 微软，AT&amp;T 和 Google 的实验室。为了提高外国人的英语水平，贾里尼克用自己的经费为他们请私人英语教师。 <BR><BR>贾里尼克生活俭朴，一辆老式丰田车开了二十多年，比组里学生的车都破。他每年都邀请组里的学生和教授到家里做客，很多毕业了的学生也专程赶来聚会。在那里，他不再谈论学术问题，而会谈些巩俐的电影（他太太是哥伦比亚大学电影专业的教授），或是某著名教授被拉斯韦加斯的赌馆定为不受欢迎的人等等。但是他聚会的食物实在难吃，无非是些生胡萝卜和芹菜。后来贾里尼克掏钱让系里另一个教授承办聚会，那个教授每次请专业大厨在家作出极丰盛的晚宴，并准备许多美酒，从此这种聚会就转移到那个教授家了。 <BR><BR>除了巩俐的电影，贾里尼克对中国的了解就是清华大学和青岛啤酒了。他有时会把两个名字搞混，有两次被香港科技大学的 Pascale 冯教授抓住。<BR><BR>贾里尼克说话心直口快，不留余地。在他面前谈论学术一定要十分严谨，否则很容易被他抓住辫子。除了刚才提到的对语言学家略有偏见的评论，他对许多世界级的大师都有过很多“刻薄”但又实事求是的评论，这些评论在业界广为流传。贾里尼克在四十多年的学术生涯中居然没有得罪太多的人 ，可以说是一个奇迹。<BR><BR>注释一：<BR><BR>贾格布森的通信模型 <BR>1 上下文<BR>2 <BR>信息<BR>3 <BR><BR>发送着 --------------- 4 接收者<BR>5 <BR><BR>信道<BR>6 编码<BR><BR><BR>本文出自:&nbsp;&nbsp;<A href="http://googlechinablog.com/2006/06/blog-post_08.html"></A></div>]]></description>
	    <author><![CDATA[mjliao]]></author>
	    <comments>http://mjliao.blog.163.com/blog/static/37535193200783073257992</comments>
    <slash:comments>0</slash:comments>
    <guid isPermaLink="true">http://mjliao.blog.163.com/blog/static/37535193200783073257992</guid>
    <pubDate>Sun, 30 Sep 2007 07:32:57 +0800</pubDate>
    <dcterms:modified>2007-09-30T07:33:47+08:00</dcterms:modified>
  </item>    
  <item>
  	<title><![CDATA[我的密友]]></title>	
    <link></link>
    <description><![CDATA[<div>
			<a href="http://blog.163.com/blog_admin/" target="_blank"><img src="http://ava.blog.163.com/photo/kXzRnDawt6_9QjnRphn-yA==/177610710304674017.jpg" border="0" />博客小管</a>
			<a href="http://blog.163.com/blog_help/" target="_blank"><img src="http://ava.blog.163.com/photo/p92cXXW9nKVEQlNvrF8zOg==/422493940044569039.jpg" border="0" />博客小助</a>
			<a href="http://sulyn.l74.blog.163.com/" target="_blank"><img src="http://ava.blog.163.com/photo/K6giq_0vOYcnEpcErR1uJA==/169729410957337723.jpg" border="0" />雜草</a>
			<a href="http://blog.163.com/happyzhangbing@126/" target="_blank"><img src="http://ava.blog.163.com/photo/Z7ARkUIpR15VbkHJom-BpA==/175077435514204205.jpg" border="0" />like 轮 回</a>
			<a href="http://ldiv.blog.163.com/" target="_blank"><img src="http://ava.blog.163.com/photo/MYDR1RuunyaOVLKXJeEQGg==/451204387667916847.jpg" border="0" />ldiv</a>
</div>]]></description>
    <guid isPermaLink="false">http://mjliao.blog.163.com/friends</guid>
    <pubDate>Tue, 1 Jan 2008 00:00:00 +0800</pubDate>
    <dcterms:modified>2008-01-01T00:00:00+08:00</dcterms:modified>
  </item>    
 </channel>
</rss>