2006年2月28日星期二
台湾在考验大陆
我个人感觉,这是台湾走向“台独”的第一步,在试探,也在冒险。这是一盘双方都难下的棋,大陆肯定不希望台湾这个时机走这步棋。
当然,我等小民其实不必关心这些事情,也不必爱国,什么叫爱国其实我们也不懂。在外交问题上我们应该相信政府,目前我国正面临难得的战略机遇期,我们要抓住机遇,倍加珍惜安定团结的大好局面,维护社会稳定,努力做好我们的本职工作,就是最好的爱国表现。
不过我也提醒一下,就连腐败无能、丧权辱国的清政府也是战败于日本之后才被迫割让的台湾。如果我们连仗都不打就丢掉了台湾,那就太说不过去了。
2006年2月25日星期六
搜索引擎技术揭密:中文分词技术
搜索引擎技术的研究,国外比中国要早近十年,从最早的Archie,到后来的Excite,以及altvista、overture、google等搜索引擎面世,搜索引擎发展至今,已经有十几年的历史,而国内开始研究搜索引擎是在上世纪末本世纪初。在许多领域,都是国外的产品和技术一统天下,特别是当某种技术在国外研究多年而国内才开始的情况下。例如操作系统、字处理软件、浏览器等等,但搜索引擎却是个例外。虽然在国外搜索引擎技术早就开始研究,但在国内还是陆续涌现出优秀的搜索引擎,像百度(http://www.baidu.com)等。目前在中文搜索引擎领域,国内的搜索引擎已经和国外的搜索引擎效果上相差不远。之所以能形成这样的局面,有一个重要的原因就在于中文和英文两种语言自身的书写方式不同,这其中对于计算机涉及的技术就是中文分词。
什么是中文分词
众所周知,英文是以词为单位的,词和词之间是靠空格隔开,而中文是以字为单位,句子中所有的字连起来才能描述一个意思。例如,英文句子I am a student,用中文则为:“我是一个学生”。计算机可以很简单通过空格知道student是一个单词,但是不能很容易明白“学”、“生”两个字合起来才表示一个词。把中文的汉字序列切分成有意义的词,就是中文分词,有些人也称为切词。我是一个学生,分词的结果是:我 是 一个 学生。
中文分词和搜索引擎
中文分词到底对搜索引擎有多大影响?对于搜索引擎来说,最重要的并不是找到所有结果,因为在上百亿的网页中找到所有结果没有太多的意义,没有人能看得完,最重要的是把最相关的结果排在最前面,这也称为相关度排序。中文分词的准确与否,常常直接影响到对搜索结果的相关度排序。笔者最近替朋友找一些关于日本和服的资料,在搜索引擎上输入“和服”,得到的结果就发现了很多问题。下面就以这个例子来说明分词对搜索结果的影响,在现有三个中文搜索引擎上做测试,测试方法是直接在Google(http://www.google.com)、百度(http://www.baidu.com)上以“和服”为关键词进行搜索:
在Google上输入“和服”搜索所有中文简体网页,总共结果507,000条,前20条结果中有14条与和服一点关系都没有。
在百度上输入“和服”搜索网页,总共结果为287,000条,前20条结果中有6条与和服一点关系都没有。
在中搜上输入“和服”搜索网页,总共结果为26,917条,前20条结果都是与和服相关的网页。
这次搜索引擎结果中的错误,就是由于分词的不准确所造成的。通过笔者的了解,Google的中文分词技术采用的是美国一家名叫Basis Technology(http://www.basistech.com)的公司提供的中文分词技术,百度使用的是自己公司开发的分词技术,中搜使用的是国内海量科技(http://www.hylanda.com)提供的分词技术。由此可见,中文分词的准确度,对搜索引擎结果相关性和准确性有相当大的关系。
中文分词技术
中文分词技术属于自然语言处理技术范畴,对于一句话,人可以通过自己的知识来明白哪些是词,哪些不是词,但如何让计算机也能理解?其处理过程就是分词算法。
现有的分词算法可分为三大类:基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法。
1、基于字符串匹配的分词方法
这种方法又叫做机械分词方法,它是按照一定的策略将待分析的汉字串与一个“充分大的”机器词典中的词条进行配,若在词典中找到某个字符串,则匹配成功(识别出一个词)。按照扫描方向的不同,串匹配分词方法可以分为正向匹配和逆向匹配;按照不同长度优先匹配的情况,可以分为最大(最长)匹配和最小(最短)匹配;按照是否与词性标注过程相结合,又可以分为单纯分词方法和分词与标注相结合的一体化方法。常用的几种机械分词方法如下:
1)正向最大匹配法(由左到右的方向);
2)逆向最大匹配法(由右到左的方向);
3)最少切分(使每一句中切出的词数最小)。
还可以将上述各种方法相互组合,例如,可以将正向最大匹配方法和逆向最大匹配方法结合起来构成双向匹配法。由于汉语单字成词的特点,正向最小匹配和逆向最小匹配一般很少使用。一般说来,逆向匹配的切分精度略高于正向匹配,遇到的歧义现象也较少。统计结果表明,单纯使用正向最大匹配的错误率为1/169,单纯使用逆向最大匹配的错误率为1/245。但这种精度还远远不能满足实际的需要。实际使用的分词系统,都是把机械分词作为一种初分手段,还需通过利用各种其它的语言信息来进一步提高切分的准确率。
一种方法是改进扫描方式,称为特征扫描或标志切分,优先在待分析字符串中识别和切分出一些带有明显特征的词,以这些词作为断点,可将原字符串分为较小的串再来进机械分词,从而减少匹配的错误率。另一种方法是将分词和词类标注结合起来,利用丰富的词类信息对分词决策提供帮助,并且在标注过程中又反过来对分词结果进行检验、调整,从而极大地提高切分的准确率。
对于机械分词方法,可以建立一个一般的模型,在这方面有专业的学术论文,这里不做详细论述。
2、基于理解的分词方法
这种分词方法是通过让计算机模拟人对句子的理解,达到识别词的效果。其基本思想就是在分词的同时进行句法、语义分析,利用句法信息和语义信息来处理歧义现象。它通常包括三个部分:分词子系统、句法语义子系统、总控部分。在总控部分的协调下,分词子系统可以获得有关词、句子等的句法和语义信息来对分词歧义进行判断,即它模拟了人对句子的理解过程。这种分词方法需要使用大量的语言知识和信息。由于汉语语言知识的笼统、复杂性,难以将各种语言信息组织成机器可直接读取的形式,因此目前基于理解的分词系统还处在试验阶段。
3、基于统计的分词方法
从形式上看,词是稳定的字的组合,因此在上下文中,相邻的字同时出现的次数越多,就越有可能构成一个词。因此字与字相邻共现的频率或概率能够较好的反映成词的可信度。可以对语料中相邻共现的各个字的组合的频度进行统计,计算它们的互现信息。定义两个字的互现信息,计算两个汉字X、Y的相邻共现概率。互现信息体现了汉字之间结合关系的紧密程度。当紧密程度高于某一个阈值时,便可认为此字组可能构成了一个词。这种方法只需对语料中的字组频度进行统计,不需要切分词典,因而又叫做无词典分词法或统计取词方法。但这种方法也有一定的局限性,会经常抽出一些共现频度高、但并不是词的常用字组,例如“这一”、“之一”、“有的”、“我的”、“许多的”等,并且对常用词的识别精度差,时空开销大。实际应用的统计分词系统都要使用一部基本的分词词典(常用词词典)进行串匹配分词,同时使用统计方法识别一些新的词,即将串频统计和串匹配结合起来,既发挥匹配分词切分速度快、效率高的特点,又利用了无词典分词结合上下文识别生词、自动消除歧义的优点。
到底哪种分词算法的准确度更高,目前并无定论。对于任何一个成熟的分词系统来说,不可能单独依靠某一种算法来实现,都需要综合不同的算法。笔者了解,海量科技的分词算法就采用“复方分词法”,所谓复方,相当于用中药中的复方概念,即用不同的药才综合起来去医治疾病,同样,对于中文词的识别,需要多种算法来处理不同的问题。
分词中的难题
有了成熟的分词算法,是否就能容易的解决中文分词的问题呢?事实远非如此。中文是一种十分复杂的语言,让计算机理解中文语言更是困难。在中文分词过程中,有两大难题一直没有完全突破。
1、歧义识别
歧义是指同样的一句话,可能有两种或者更多的切分方法。例如:表面的,因为“表面”和“面的”都是词,那么这个短语就可以分成“表面 的”和“表 面的”。这种称为交叉歧义。像这种交叉歧义十分常见,前面举的“和服”的例子,其实就是因为交叉歧义引起的错误。“化妆和服装”可以分成“化妆 和 服装”或者“化妆 和服 装”。由于没有人的知识去理解,计算机很难知道到底哪个方案正确。
交叉歧义相对组合歧义来说是还算比较容易处理,组合歧义就必需根据整个句子来判断了。例如,在句子“这个门把手坏了”中,“把手”是个词,但在句子“请把手拿开”中,“把手”就不是一个词;在句子“将军任命了一名中将”中,“中将”是个词,但在句子“产量三年中将增长两倍”中,“中将”就不再是词。这些词计算机又如何去识别?
如果交叉歧义和组合歧义计算机都能解决的话,在歧义中还有一个难题,是真歧义。真歧义意思是给出一句话,由人去判断也不知道哪个应该是词,哪个应该不是词。例如:“乒乓球拍卖完了”,可以切分成“乒乓 球拍 卖 完 了”、也可切分成“乒乓球 拍卖 完 了”,如果没有上下文其他的句子,恐怕谁也不知道“拍卖”在这里算不算一个词。
2、新词识别
新词,专业术语称为未登录词。也就是那些在字典中都没有收录过,但又确实能称为词的那些词。最典型的是人名,人可以很容易理解句子“王军虎去广州了”中,“王军虎”是个词,因为是一个人的名字,但要是让计算机去识别就困难了。如果把“王军虎”做为一个词收录到字典中去,全世界有那么多名字,而且每时每刻都有新增的人名,收录这些人名本身就是一项巨大的工程。即使这项工作可以完成,还是会存在问题,例如:在句子“王军虎头虎脑的”中,“王军虎”还能不能算词?
新词中除了人名以外,还有机构名、地名、产品名、商标名、简称、省略语等都是很难处理的问题,而且这些又正好是人们经常使用的词,因此对于搜索引擎来说,分词系统中的新词识别十分重要。目前新词识别准确率已经成为评价一个分词系统好坏的重要标志之一。
中文分词的应用
目前在自然语言处理技术中,中文处理技术比西文处理技术要落后很大一段距离,许多西文的处理方法中文不能直接采用,就是因为中文必需有分词这道工序。中文分词是其他中文信息处理的基础,搜索引擎只是中文分词的一个应用。其他的比如机器翻译(MT)、语音合成、自动分类、自动摘要、自动校对等等,都需要用到分词。因为中文需要分词,可能会影响一些研究,但同时也为一些企业带来机会,因为国外的计算机处理技术要想进入中国市场,首先也是要解决中文分词问题。在中文研究方面,相比外国人来说,中国人有十分明显的优势。
分词准确性对搜索引擎来说十分重要,但如果分词速度太慢,即使准确性再高,对于搜索引擎来说也是不可用的,因为搜索引擎需要处理数以亿计的网页,如果分词耗用的时间过长,会严重影响搜索引擎内容更新的速度。因此对于搜索引擎来说,分词的准确性和速度,二者都需要达到很高的要求。目前研究中文分词的大多是科研院校,清华、北大、中科院、北京语言学院、东北大学、IBM研究院、微软中国研究院等都有自己的研究队伍,而真正专业研究中文分词的商业公司除了海量科技以外,几乎没有了。科研院校研究的技术,大部分不能很快产品化,而一个专业公司的力量毕竟有限,看来中文分词技术要想更好的服务于更多的产品,还有很长一段路。
作者:Winter
2006年2月15日星期三
如何解释黄片、毛片、女优、钢管舞
名词解释:
黄片:故事片的一种,因为场景以黄色调为主而得名,日本出产的这一类电影最为出色。这类电影一般是低成本电影,不要说道具,有时候连演员的衣服的提供不上。都说日本有钱,可是他们的黄片还不如老谋子的《英雄》制作大。
毛片:盗版碟的一种,因为做工粗糙,甚至带有毛刺,因此被老百姓气愤的称为毛片。不过有不法分子把毛片联想成纪念伟大领袖毛主席的主旋律影片也简称为毛片,这是非常让人愤慨的,这是非常不要脸的!
A片:英语过四级的同学都知道是美国片-American片-A片。据悉:最近比较热门的电影《指环王》、《冷山》都是A片,我国每年要进口一定数量的A片,但是为了不冲击国产影片,中影集团电影进出口公司对A片需要经过严格的挑选,而且还有数量限制。只有符合中国人传统观念的优秀A片才在引进之列,虽然保护野生动物是好的,但是表现对野生动物过分“溺爱”的A片也是不会被引进的。
AV女优:这个词还不为光大青少年所熟知是因为这个词对英语的要求很高,A前文说了,代表美国,V代表佛蒙特州(VERMONT),这个州的人民很优秀,人们就称之为“AV女优,AV男优”,因为这个州的女的特别优秀,所以AV女优更常见一些。
钢管舞:起源于美国的一种劳动人民自编自演的舞蹈,最初是一些建筑工人中流传开来,他们拿着建筑钢管一边跳舞一边歌唱,表现了美利坚民族开朗乐观的民族性格。钢管舞是世界十大民间舞蹈之一。
走光:一些单身汉的口头禅,比如:听到××有美女,赶快去看,结果美女都走了,于是叹息:“美女走光了”,渐渐的在社会上流传开来,表达了单身汉们的一种渴望爱情的思想感情,词义和现在的“郁闷”差不多。
自摸:打麻将的时候的一种赢钱方法,自己摸到要的牌,与之对应的是点炮。但是因为自摸不求人,所以更受一些人的欢迎。
无码:顾名思义,就是没有码,没有防伪标码的电影属于广大人民群众深恶痛绝的假冒伪劣产品,也是消费者协会的重点打击对象。
做爱:一种懒人用的很烂的简写,全称是“做爱做的事情”泣血求求各位小朋友,务必说全称。
性感:又是误用,其实应该写作“姓感”,感姓是用的很少的姓氏,主要分布于中国××,自从这个词被误用那里的女同志非常苦恼,因为有的时候有这样的对话:男:“小姐,请问您贵姓?”女:“(汗)免贵我性感。”不过他们还不是最惨的,因为还有人姓焦,总算没有人姓这个复姓--冷淡。
露点:读做 lu dian 小男生的一种很矫情的叫法,其实就是早晨草叶上的露珠。露点视频就是《人与自然》拍摄的一集露珠形成过程的科教片。
二奶: ①二奶奶:二爷爷的妻子。②咪咪:参见下一个名词解释。
咪咪:小猫咪,特指那种刚刚生出来的很小很乖的可爱的小猫,比如:哆拉A梦和杰瑞就是两个注明的咪咪。
包二奶: ①姓包人家的二奶奶。②胸罩
自拍:因为工作不顺心,因此一些女生决定抗议,因此他们决定用板砖往身上砸,简称“自拍”。
偷拍:后来人民政府为了保护这些女生的健康取缔自拍了,她们只好趁警察叔叔不注意,偷偷的往自己脸上来上一板砖,其实就是偷偷的自拍,简称“偷拍”。只有失去了才知道珍惜,不能随便自拍了,因此女生们偷拍时一般往死里拍。
三版女郎:知道了什么是自拍,三版女郎就容易理解了,就是曾经拍了自己三板砖的女郎。
SM:FM、AM之前的收听广播的方式,这个方式的特点是……嗯,用绳子,有时候也用锁链做天线,虽然现在看来哇噻,听个广播还用绳子,用不用那么费劲啊?但是当时那个时候人们还是很快活的,现在这种技术在我国已经基本淘汰了,在日本、美国等国家还有少量存在。
艳舞:起源于日本社会底层的民间舞蹈,舞蹈者一般衣不蔽体,说明了资本主义社会两极分化严重,同时也体现了社会主义的优越性。但我们不能放松警惕,因为随着改革开放我国的两极分化也日渐严重,某些地方也出现了这种舞蹈,真是可怜。
波霸:从香港台湾传过来的词,波就是球,踢波就是踢球,波霸就是球王,世界上最大的最有名的波霸是巴西的贝利,马拉多纳和贝肯鲍尔虽然小了点也勉强算波霸吧。
3P:如果你的孩子问这个词,你一定要好好看看他最近在看什么书,这个词很有难度,但是也是可以解释的:3P是日本某公司推出的一款游戏机,因为可以支持三个人同时玩,所以被游戏玩家亲切的称为3P。(这个解释的后果是小孩大喊:“我要3P”,你应该做的是趁他还没有喊出来,捂住他的嘴,开始许下承诺,给他买一个微软最新的XBOX,支持XXX人同时玩,条件是他闭嘴。)
2006年2月14日星期二
慨叹FreeBSD和SourceForge被封
FreeBSD是一个自由的,源自AT&T UNIX的操作系统。可以说它是正统的UNIX后代。FreeBSD是一个完整的操作系统,包含了从开发工具到各种各样的应用程序。它由一个软件开发的核心团队来维护,整个原始程序代码会有组织地进行更新,所以程序代码比较有一致性。FreeBSD主要是由它的核心小组来发布。FreeBSD的目标是提供一个坚如磐石的系统。它的技术性能是有目共睹的,十几年的开发使它成为一个“坚如磐石”的网络操作系统,有许许多多的大网站和ISP在运行着FreeBSD,免费和开放的特性使得它成为商业计算和科学研究的极佳平台。
Google、Yahoo、甚至新浪网等大型网站的服务器都大量使用FreeBSD操作系统。可以说,大型网站服务器使用的操作系统基本上不是FreeBSD就是Linux了。
然而令人不解的是,FreeBSD的官方网站 http://www.freebsd.org/ 不知何故长期被中国电信封锁,不让国内人访问。其官方网站是英文的,基本上只有非常专业的技术人员(比如高级网管)才会访问,为什么FreeBSD这样的专业网站都会被封呢?我绞尽脑汁也想不出封他的理由,唯一的解释就是:中国电信对Free这个单词的恐惧已经到了歇斯底里的地步了。
另外一个遭到封杀毒手的专业网站是SourceForge。
SourceForge 是全球最大的开放源代码软件开发平台和仓库。它集成了很多开放源代码应用程序,为软件开发提供了整套生命周期服务。SourceForge.net是开放源代码软件的开发者进行开发管理的集中式场所,也是源代码仓库。大量开源项目在此落户(2005年5月已经超过一百万),包括维基百科使用的MediaWiki,但也包含很多休眠和单个用户的项目。
SourceForge虽然也是英文界面的专业网站,但这个庞大的开放源代码软件仓库也长期被中国电信封锁,封锁的原因据说是里面有一个名为FreeNet的代理服务器的源代码软件项目。
我知道,中国的软件业永远也赶不上发达国家,甚至赶不上印度,其中最主要的原因就是有一大批中国人在系统地残害和阻挠中国软件业的发展,他们热衷于购买国外的软件硬件产品(能捞到回扣?),而对民族软件业的发展百般阻挠,这些人是中国永远的耻辱,做为一个软件开发工程师,我们能够做到的就是牢记这段历史,知耻而后勇,中国软件业才会有希望。
2006年2月3日星期五
韩乔生语录大全
1. “...随着守门员一声哨响,比赛结束了...”
2. “...各位观众,中秋节刚过,我给大家拜个晚年...”
3. “现在由中国队守门员范志毅开任意球...”
4. “队员在平时的训练中一定要加强体能和对抗性训练,这样才能适应比赛中的激烈程度,否则的话,就会像不倒翁一样一撞就倒...”
5. “忽如一夜春风来,意甲流行三后卫...”
6. “国外的球员都非常敬业,比如马特乌斯,小孩出生3个月后就上场比赛了。”
7. “范志毅前几天还在发高烧,高烧36度8;守门员区楚良身高1米82,体重28公斤。”
8. “中国队一脚射门,被区楚良奋勇扑出...”
9. “在上周刚举行了一场别开婚面的生礼。”
10.“可能有的观众刚刚打开电梯,我们再把比分...”
11.“巴乔在前有追兵,后有堵截的情况下带球冲入禁区...”
12.“水晶宫队已经赛了7场,2胜2平4负... ”
13.“这球算进,门将进球无效...”
14.“已经有很多俱乐部表示要购买皮耶罗,拉齐奥出价3000万美元,曼联出价更高,2800万美元。”
15.“××队后卫严重犯规,裁判将前锋××罚下场。”
16.(德甲)“现在场上火药味很浓,两队队员在场上你争我抢,两队的教练也在场下争风吃醋。
17.“全兴队××号发角球,由寰岛队××号头球建功!”
18.“每一寸草皮都在进行激烈的争夺... ”
19.“佛罗伦萨队中场犯规,不,在禁区前罚球弧顶犯规,...”
20.“AC米兰就像一台计算机,内存挺大,大到奔腾II代,可是运行不快,可能是感染病毒,看来主教练扎切罗尼需要一张杀毒的硬盘!!...”
21.“因为李金羽的身高比对方队员矮,因此在拚抢的时候他的肘部碰到了对方的脸上。”
22.“主教练将××队的裁判罚出场外...”
23.“AC米兰队目前以1:3领先...”
24.“把球一脚射进了大门...我们来看看慢动作.....哦...是用头顶进的”
25.“只见防守队员一个队员两条腿,两个队员四条腿,三个队员八条腿....”
26.“守门员将球回传给门将...”
27.现在是陕西国力与×××的下半场比赛,场上比分还是0:0.这个球是小将常辉在上半场26分钟时攻进的。
28.“18号传球,张效瑞跳起头球攻门,进球的是18号张效瑞!”
29.“解围的队员本来是要将球踢出底线的,可是没想到这球有很大的旋转,居然出了端线...”
30.“××球员30公里外一脚远射!”
31.“……一个球迷跑到球场中央,踢翻了广告牌!”
32.“只见××队的前锋象两把菜刀……”
33.“好!前锋一脚大力抽射,皮球应声进入网窝!比分还是1:1平,在球飞进球门的一瞬间,裁判员的哨声响了,这球算进,没有越位,比分变成了2:0,××队领先一分。”
35.“这球进了!姜还是老的辣,××队10号小将再立新功。”
36.“球被守门员的后腿挡了一下!!!
37.×××以迅雷不及掩耳盗铃之势……
38.本轮过后,拉齐奥队以6胜3平1负积21分的不败战绩排在首位,尤文图斯以22分紧随其后。
39.AC米兰的舍甫琴科以7个入球排在射手榜首位,克雷斯波,维埃里以6个入球并列第二。(此时画面翻页),巴蒂排在第四位,进6球。
40.2000-2001赛季,德甲,异常响亮的一个嗝,满座皆惊。
46.马尔代夫队今天超水平发挥了150%!
47. 9号维阿一脚射门,守门员维阿把球扑了出来,好险啊!
48. ××跟上一脚凌空抽射,球进了。这是他本赛季攻入的第13粒头球。
49.这名队员的身高达到了1.90厘米
50.一定要利用场地的宽度,多打身后,多打直传球。
51.在比赛开始以前,韩乔生说:“今天来自演艺界的歌手门也来到西安为中国国家队----拉油加喊————”
52.“守门员示意比赛继续进行...”
53.“漂亮的反越位...哦,不是,没有成功...”
54.“重庆队已经用完了三个换人名额...怎么重庆队还要换人?”
55.“下半场换上23号以后作用很大...”是上半场换的啊,“23号能拿球,能传球...”
56.世界田径锦标赛,韩乔生同志说“显示牌上显示的数字,是××(三级跳运动员)起跳点距踏板的距离,也就是说,他是在距离踏板15米处起跳.”(应为15cm)
57.9月1日凌晨阿卡之站,下半场卡塔尔进球:“精彩的任意球直接破网,噢!中间好象还有一个明显的变线。”
58.直播意甲,国际米兰,韩老师先捧了一会儿张路,哄的张路傻乐了半天,然后老韩就把嘴冲向维埃里,说维埃里是现在世界上身价最高的球员,顿了顿,口气特危言耸听的来了一句:“九万亿里拉!”(应为900亿)
59.巴西队的后防线是清一色的巴西队员
60.韩乔生同志说“下面看一看意甲排行(Xing)榜”
61.上海申花队14号申花一脚抽射!
62.2001年甲A直播,中场时播报沈阳队与另一个队的比分,可能导播把比分提示错了,韩大腕把笔往桌上一摔,吓了吴金祥一跳。
63.“阿联酋的远射质量很高...阿联酋队加强远射,目的是造成中国队的门将杨璞脱手......”
64.9月27日中国客场对阿联酋:守门员杨璞扑球脱手了.
65.“中国队的守门员杨璞一个大脚把球开到前场,对不起,中国队的守门员是杨琦。”(安琦)
66.9月27日中国客场对阿联酋:这是中国队上半场第一次射门…除了任意球射门之外.
67.9月27日中国客场对阿联酋:卡塔尔换上十号,加强中前场的进攻
68.9月27日中国客场对阿联酋:卡塔尔边路的突破很厉害
69.9月27日中国客场对阿联酋:上半场到现在,阿联酋队的两次射门都打在门框外了。(屏幕下面英文的统计:2次射门,1次门框内),好在韩英文功底扎实,改过来了。
70.9月27日中国客场对阿联酋:传给了3号杨晨(璞)…(杨晨已下场)
71.守门员安琦参加了今年在墨西哥举办的世乒赛
72.好、守门员安琪来了一个空中接月,将球稳稳地抱在手中。
73.由于张恩华没有适应自已的新位置,经常找不到人,所以(后卫)范志毅和孙继海经常要直接面对对方的守门员。
74.由于阿曼的攻势很猛,所以中国队千万要大意
75.沈阳的天气很冷,所以阿曼队要有一个逐渐的不适应过程
76.10月7号中国对阿曼:10号杨晨头球摆渡,于根伟和20号(也是杨晨)抢点
77.赛前6个小时可以改上场球员名单,哦不,是赛前60分钟
78.(在已经说了好几次阿曼教练的情况下)说阿曼的教练××尔,哦不,是贾巴尔
79.郝海东经常在自己能够得分的情况下还给队员创造机会
80.下面由孙继海掷界内球(界外,没有界内球这一说)
81.值场主裁判示意要补时2分钟
82..我们可以看到阿曼是一支业余球队,尽管有好几次射门机会,但准确性很…到目前为止,中国队还没有射门
83.好球!范志毅一个‘前防’,抢在对方队员之前把球破坏了
84.现在比赛已经进行到了伤停补时的第46分钟了
85.这时候来自新加坡的主裁判麦丁吹响了上半场比赛结束的哨声(10分钟前还叫人家马丁呢)
86.现在还有一个悬念,就是中国队进入十强赛后,在一场比赛中还没有上下半场都进球,要么上半场进球,要么下半场进球,而且在沈阳的两个主场比赛中,还没有在这一侧的球门进过球。我们倒要看看中国队能不能在今天打破这个悬念
87.对方主教练十分活跃,在后场大举的排兵布阵。(他能怎么活跃?跳进场?)
88.面对对方两个人四条腿儿,孙继海把球传了出去(事实情况是对方三个人防守
89.孙继海好象有魔法似的,没有看到来球就把球断了下来...你说我后脑勺上没长眼睛,你凭什么把球传给我?
90.“如果赢了这场球后,可以说目前中国队已经达到了巅疯状态了”
91.“如果中国队今晚实现了出线,那么可以说米卢是世界上首位率领5支国家队杀入世界杯16强的教练...哦..是杀入决赛圈”
92.杨璞已经被×××突破3次了,上半场1次,下半场1次...居然出了端线...“
93.“和我一样的球迷现在已经是白发苍苍了”
94.“今天沈阳的温度是11度,湿度是70%,热度是99%,呆会能达到100%”,“现在热度达到了200%”
95.今天的传球准确率达到了90%
96. 6号孙继海; 7号: ×××; 9号郝海东
97.(转播NBA总决赛)今天转播的是×××与爵士犹他队的比赛
98.双方球迷入场热身做准备活动,比赛马上就要开始。
99.只见AC米兰的巴蒂斯图塔突破马尔蒂尼,一脚凌空抽射,被裁判扑了出来
100.大家别看隆巴多是个秃顶,可是只有25岁,体力充沛……
101.这是明波浩,噢?不是
102.巴林的主场气氛一般,其周围的建筑不是很高,绝大多数都是一层以下的楼。
103.自从特拉帕托尼执教佛罗伦萨教鞭后...
104.“帕柳卡又一次化解了罗纳尔多极有威胁的射门。”(帕柳卡是国际米兰守门员、罗纳尔多是国际米兰队员)
105.中国四员小将在欧洲……(范志毅已经30了)
106.某场国家队的比赛,韩老师道:高峰和郝海东是中国队的两把菜刀(尖刀)
107.记得1996年的奥运会,韩大嘴转播跳水比赛:“各位观众,现在站在跳台上的是英国裁判!”
108.某场沙特队的比赛,韩老师道:场边带绿帽子的就是沙特队的主教练
109.曼联主场3:3击败巴塞罗那
110.尤文图斯向奥特加抛出了橄榄球
111. (排球)“...二传手传了个地滚球...”
112.国安队在上半时打高球“屡试不爽”,所以下半时可以尝试打打地面
113.95年争夺奥运会足球出线权中国VS沙特,当时沙特队的多萨里在中国禁区内连过数人,韩大嘴在惊叹之余连声夸奖:“足球场上本没有路,他用自己的双腿为自己趟了出一条路!”
114.连VS沪的时候,韩乔生说:“兰柯维奇一脚射门,虞伟亮把球扑出。”(都是申花球员)
115.解说伊朗对泰国的比赛,换场地后,连两边谁是谁都分不清
116.下面看两队的技术统计,两队的射门差不多...犯规倒是主队占优
117.在第一集团的意大利选手是598号Giacomo Leone (应该是581号Stefano Baldini)
作者:佚名 来源:网络
2006年2月1日星期三
电子邮件的故事:令人吃惊的预测
有一天,乔治在删除垃圾电子邮件的时候,看到这样一个标题:令人吃惊的足总杯比赛预报。他好奇地点开了它,里边写着:
亲爱的球迷,我们知道你是个怀疑论者,凡事不会轻易想念,可我们确定已经设计出了绝对准确的预报足球比赛结果的奇妙方法。今天下午,英国足总杯将进行和第三轮比赛,对垒的是考文垂队和谢菲欠德联队,我们预报考文垂队将会取得胜利。
乔治看过后,轻蔑地一笑,没有当回事。晚上,他收看电视里的比赛结果,考文垂队果然势如破竹地赢了。
三个星期后,乔治又收到了那个人的一封电子邮件:
亲爱的球迷,你是否还记得,在上一轮足总杯比赛中,我们曾事先想念准确地预报了考文垂队获胜?今天考文垂队要和密德斯堡队交手了,我们的预测是密德斯堡队获胜。同时我们强烈地奉劝你不要和别人去赌输赢,但请你密切关注比赛结果,看看我们的预测结果是否准确。
那天下午,双方打成1比1平局。考文垂队本来很强,却完全没有发挥出来。而在下个星期二加赛时,密德斯堡队却以2比0的比分胜出。这回乔治有点惊讶了。
过了几天,那个人的电子邮件又来了,预测密德斯堡队将在第五轮比赛中失利,特伦密尔队将会打败它,结果果然如此。
而在四分之一决赛之前,那封电子邮件又告诉乔治:特伦密尔队将老老实实地输给陶顿亨队。事实果然如此。
四次预报,四次全部都说中了!
接着,那个人在电子邮件中对乔治说:
我们买断了一个数学家最新的研究成果。现在你大概相信,我们确实很有把握,能够料事如神。在半决赛中,阿森纳队将会打败伊普斯维奇队。
乔治是个不服气的人,他通知了许多朋友,下午一起看球赛直播,并且计划在阿森纳输掉后,大肆羞辱那个信口开河的家伙。但是在落后的情况下,阿森纳队奋起直追,最后竟以2比1获得胜利。太不可思议了!
第二天,那个不可思议的邮件又来了,这回它说:
亲爱的球迷,你已经体验了我们神奇的足球预报,现在你信服了吧?我们已经做出了五次正确的预报,五发五中,你一定会同意它绝非运气,尤其是所有冷门我们都猜中了。现在我们和你做一笔特殊的交易:在一个月的时间内,我们向你提供比赛预报,你只需支付200英镑的定金。然后,发一封电子邮件,把参赛的两个队告诉我们,我们就会将预报结果通知你。
我们殷切地盼望收到你的订单。
200英镑的要价确实不低,但如果事先能知道哪一个队会嬴,就完全可以从彩票商的手中赢来20万英镑。
当然,乔治也怀疑过,他们是暗地里操控球赛的财团,或者是黑社会,但是这一切都与乔治没关系,只要预报结果准确就行了。于是,他掏出了200英镑。
事实上,这些人不过是一群骗子。里边或许会有几个数学家。
一开始,他们向球迷发了8000封邮件,一半是预报甲队获胜,另一半是预报乙队获胜,于是就有4000人得到的预报是准确的,另一半人则会把它当一个笑话忘掉。
下一次,他们只给得到“正确预报”的4000人发送邮件,一半是预报丙方获胜……以此类推,所谓的预测者总是给得到“正确预报”的一部分人发送新邮件,最后,剩下250人收到的预报便全部是正确的,他们当然会认为这个预报绝对灵验。其中假如有50人掏出200英镑来,对于骗局的策划者来说,就是一笔很可观的收入了。因为他们除了发送电子邮件外,不需要任何本钱。(文/罗勃.伊斯特威)
免责声明
1、本人是文盲,以上内容文字均不认识,也看不懂是什么意思(包括但不限于对所以上之内容的识别、阅读、理解、分析、记忆等);
2、本人过去、现在以及将来都不认识本文中提及当事人,且自古以来与该相对人无利益关系;
3、本人昨天、今天以及明天都没有或者不准备去本文所述地点。本文表述之事与本人无关。
4、本人在此发文(包括但不限于汉字、拼音、拉丁字母、斯拉夫字母、日语假名、阿拉伯字母、单词、句子、图片、影像、录音、以及前述之各种任意组合等等)均为随意敲击键盘所出,用于检验本人电脑键盘录入、屏幕显示的机械、光电性能,并不代表本人局部或全部同意、支持或者反对文中观点。如需要详查请直接与键盘发明者及生产厂商法人代表联系;
5、人生有风险,上网需谨慎。本文不暗示、鼓励、支持或映射读者作出生活方式、工作态度、婚姻交友、股票债券买卖、子女教育的积极或消极判断。未成年人请在监护人陪同下阅读本文。无完全民事行为能力者,请立即关闭网页,并用20%高锰酸钾+75%乙醇对键盘、硬盘、电压插座、显示器、鼠标、cpu进行灌溉消毒;
6、如本人留言违反国家有关法律,请网络管理员及时删除本文,本人保留继续发文的权利;
7、因删贴不及时所产生的任何法律(包括宪法、加法、减法、乘法、除法、剑法、拳法、脚法、指法、民法、刑法、书法、公检法、基本法、劳动法、婚姻法、输入法、没办法、国际法、今日说法、吸星大法及文中涉及或可能涉及以及未涉及之法,各地治安管理条例)纠纷或责任本人概不负责;
8、本人谢绝任何跨省(包括但不限于跨国、跨洲、跨星球、跨星系)追捕行为。确因不抓不足以平民愤,或不抓就领不到薪水养家户口的公职人员,建议携带工作证、身份证、结婚证/离婚证、独生子女证、健康证、暂住证、毕业证、边防证、县以上政府机关出具的介绍信温情操作。抓捕按照以下排序倒序:作者、原作者以及网络管理员以及网络运行商、电信运营商、电力供应商、电脑生产销售商;
9、如回复内容导致回复者或第三方、第四方、第N次方怀孕,本人愿配合做亲子鉴定。