环游bus100天 霍清风的故事

上回秋秋(秋初?)说到 环游Bus100天——柳暗

游戏规则 

  “其实,我已经等了你们很久了。你们两个也将会是这个故事里的角色。”
  月生和YOYO闻听顿时从头顶凉到脚底,比南极冰原还寒。之前的那条胳膊,警察局里奶油张的案件记录,那个哀怨的女声,等等等等恐怖诡异的经历都重新浮现出来。莫非我们年纪轻轻,就也要变成两个冤魂??月生和YOYO此时已经吓得僵立在那里,动弹不得,瞪着两双惊恐的眼睛看着眼前的这个霍清风。
  “说来话长了。其实,那个女子,她的仇人,还有我我,都并非人类。800多年前,我还只是天目山上的一条青蛇,那个女子是一株芙蓉花。(怎么还是芙蓉……)也是机缘巧合,一位老道采药炼丹,无意间洒落了些仙水,应该是不老泉之水吧。我们都饮了一些,顿时感觉如有一道光照亮了眼睛。从此,我们开始了漫长的修炼之路,日日夜夜采天地之灵气,汲日月之精华。过了800年,终于有一天,我们修成了人形。修成人形对于我们本来该是件大喜事,因为我们几百年的修炼终于有了成果。但还没等我们走出天目山,就已经发现这世界已经变了模样,到处都在打仗。我们虽然是得道之人,却也害怕那些枪弹。几百年前的冷兵器时代,那些刀枪弓箭凭我那几百年的道行可以轻松躲过,但那些枪炮一打一片,是如何都躲不过去的。我们在山里修行了几百年,等出来了,却发现以前可以叱诧风云的本领那时却已经大打了折扣。我们在山里几百年没出来,对外面的情况也一无所知,只得在山脚下的小村里先住上一阵。我给自己起了个名字。叫霍清风,她叫木晴云,我们认做兄妹。”
  “我们尽力使自己看上去和周围的人一样,但终究还是有人发现了我们的能力。于是我不得不表演一些法术,或者给人治病。没多久,杭州城里的一个大员知道了,就把我们叫去,为他做事。那时,杭州的雷峰塔虽然已经破败,还立在那里。我看着那个塔,就想起了800年前被压在下面的同胞白素贞。于是就觉得揪心。有一天晚上,我便把它弄倒了,免得天天看着心烦。挖哈哈哈。又过了几年,国民党倒了。虽然我不情愿,但我手上毕竟沾了共產黨的血。于是,就只好跟着去了台湾,她也跟我一起去了。”
  “原来的那个大员已经倒了。我觉得这几年过的实在太窝囊,就带着她到还算清净的阿里山上先修养一阵。就在阿里山上,我们碰到了同是修道之人的吴天风。这年头,修道之人比白暨豚还稀有,这一见到他,那就像是老乡见老乡啊。后来,吴天风爱上了木晴云。那时,我已经隐约感觉到,吴天风这个人的身上透着一股邪气。我这个做大哥的也劝木晴云,但他们还是好上了。过了几年,一切也都安好,我想可能是自己多虑了吧。这时候,有人发现了我的行踪,加上之前的一些传说,这阿里山也不太平了。于是我偷偷地来到这里,效忠东路的房子。我想,暂时没什么人会想到我这么个人会躲在大城市里吧。”
  “一年前,不幸的事情终于发生了。……………………”

一年前究竟发生了什么事呢? 木晴云和吴天风又是如何由情侣变成仇敌的呢?月生,YOYO,还有许纬伦同他们又有什么关系呢?欲知后事如何,那就请听下一棒来说吧。

想当年(第二回)

  上回书说到,星智要开始他的宏图壮志。这之前,有一个君之华理的论坛,是以前华理在线和华理人网合并起来的,已经积累了不错的人气。现在,星智的目标是——一个面向大学生的门户网站。

  又是在研605,星智在上面说着他的目标。星智是个很有激情的人,说得那叫惊天动地,绕梁三日。 那个门户网站叫做“君之网”。第一期要包括新闻、博客、DV、论坛、C2C电子商务。论坛就是原有的君之华理,电子商务也有一个现有的平台,其他三个频道是这次要开发的。星智觉得,博客、DV、C2C会是将来的潮流。拿现在的话说,那就是Web2.0。不过在那个时候还没有这个说法。不得不说,星智还是很有先见之明的。03年的时候做博客的还没几家,最有名的就是BlogChina和Blogcn;做视频共享的似乎还没有。不过也是由于这个原因,我们没有多少可供参考学习的。做博客的时候,就是参考的BlogChina和Blogcn。对博客的理解也就有很多局限性。比如认为博客是个人专栏,是发表自己的文章的途径。而对博客的重要特点开放、聚合却没有多少认识。可以说,那时我们对于博客的认识只停留在一些表面现象。所以,做出来博客频道也就是一个个人专栏,虽然从外表上看和现在的博客很像,也有模板,也有日历,但却缺少了RSS、Feedback。不过当时的用户也是如此,所以也没人发现我们的“博客”其实并不博客。对DV也是如此。当时不少大学都有民间拍DV电影的。我们学校也是如此,而且还弄的小有名气。和现在的视频共享保罗万象不同的是,我们当时的DV频道主要做的就是这些DV电影,把各个大学的作品集中起来。虽然也提供一个发布作品的平台,但由于网站的基调如此,参与度也就不高。毕竟有能力拍像回事的电影的人毕竟是极少数。从这方面看,我们那时候做的其实也不能算Web2.0,至多能算Web1.5。

  经过一段时间的开发后,君之网一期上线了。为此,我们还买了一台自己的服务器。我还记得,那时是用一辆自行车把服务器推到办公的地方的——这是星智在教工宿舍区租的一套房子。一段时间下来,用户的反映也还不错,但用户数量也少得可怜,基本上就是原先君之华理的一些铁杆成员。然而星智的雄心壮志还远不止如此,他要开始准备创办自己的公司了。当然,这本来就是他的目标。不然怎么叫创业团队呢?

欲知后事如何,且听下回分解。

想当年(第一回)

  2003年,那是一个秋天。话说某一天,那时我休学回来继续读大一。我在宿舍楼下看到一个招人的广告。是一个叫Beyond的团队的。招募技术策划市场等等。我就琢磨着要着找个机会学习学习,就决定去看看。而这之前,我就给自己社团晨风文学社做过一个网站,刚自己学了点ASP。其他的页面设计之类的也会一点。那时,其实心里很没底,不晓得自己这点水平人家要不要。但跑了到了那边,记得是研605,填完简历,把这些都写了上去,还有之前玩的VB,以及Office之类的软件都写了上去。没想到,他们看了简历却像发现了宝一样。老江握着我的手说“人才啊~~~”,搞得我受宠若惊的。不过我看看了看其他人留下的简历,发现我还真的是不一样。原来,会了那一点东西就已经是人才了。我就这样加入了这个由几个学长搞的一个创业团队。老大星智是学校的CIC(计算机信息交流协会)的前任社长,当时大四。团队里还有DavidWu、笔神、DigitSonic、Fishricky、Kita、老江、蓝海天等等,我在里面还只算个小朋友。

  我接手的第一个“项目”是给的CIC和九城的“奇迹”的一个合作活动做一个报名投票的网站。美工已经设计好了页面,我要把程序加上。那时候,虽然我给文学社做了网站,但是这是在网上找的一个现有的网站的基础上改的,还没有独立做过网站,就一边研究一边做。那时宿舍里的电脑还不能上网,碰到搞不懂的问题就去问楼上的DigitSonic。就这样,第一个项目也就顺利完成了。

  第二个项目是学校的化工原理精品课程的网站。fishricky做美工,我做程序。fishricky是工业设计的学长,比我大两届。在他们学院的机房,我才第一次看到怎么用Photoshop切出网页的,也是第一次看到自己在设计方面的差距。接下去我写程序,这次ASP已经是入门了,没有碰到什么大的障碍。在写程序的时候,我开始明白要把一些公用的东西提出来,减少重复。也开始复用代码。不过那时的复用方式是Ctrl+C,Ctrl+V,复制粘贴一些相似代码,然后把不同的地方改一下,比如翻页列表。之后也就很有成就感地拿到了平生第一笔工钱600RMB。

  之后,老大星智打算要开始他的宏图壮志,做大事了。

 

欲知后事,且听下回分解。

 

春天

  春天来了。春天是睡觉的季节,不然怎么说春眠不觉晓呢?前一阵白天上班,晚上赶开题报告和文献翻译,累的一塌糊涂。昨天就休息了一天,忍着没去开电脑。结果今天早上还是挣扎了半天才爬起来。不容易的啊。接下来要开始弄毕业设计,好在已经有底了。还是这样,每天弄一点,这样不会太累。

  接下去就该是春暖花开的时候了。去年这时候和老虎考拉星星一起到杭州玩了一圈。做学生的时候有个好处 ,跷课代价小。上班了请假那可都是RMB啊~~~。不过也还是可以乘双休日随便走走的。说是月底要去拓展?想起一些前辈的经历,害怕ing。

   难得报了一次流水账。

翻译Over了

  本来老师给了一篇,但字数还不够。所以自己又找了一篇。
  这篇是关于中文分词的,《不使用词库和手动训练数据的中文分词》中国人写的英文论文。还是很有意思的。 哪天有空了自己实现一个看看。而老师给的那篇我翻完了还没搞懂。

摘要:中文分词是任何NLP(自然语言处理系统)的第一步。本文展示了一种新的不使用任何词库和手动语料的中文分词算法。算法需要的统计数据,即字符间的相互信息和t分值的差异是从原始中文集中自动得出的。预备实验显示了我们的分词精度是可接受的。我们希望这个方法的成果可以该经已存在的分词的性能(尤其是处理未知词的能力和适应不同领域的能力),尽管这个算法本身也可以在一些NLP应用中被用来作为一个独立的分词器。

Lucene学习笔记

  最近用Lucene开发全文检索。《Lucene in Action》这本书用的是Lucene 1.4。我自己下的是最新的2.1。然后就发现了很多不同的地方。

 Field没了Keyword、UnIndexed、UnStored、Text这几个静态成员,只能用
Field(String, String, Store, Index)。
Keyword对应Field.Store.YES, Field.Index.UN_TOKENIZED,
UnIndexed 对应Field.Store.YES, Field.Index.NO,
UnStored对应Field.Store.NO, Field.Index.TOKENIZED,
Text对应Field.Store.YES, Field.Index.TOKENIZED。

FSDirectory.getDirectory的有两个参数的变成了depresed 了。现在要用只有一个参数的。

BooleanQuery的add方法也变了。原来是用两个boolean值组合的,现在 使用BooleanClause.Occur的几个静态成员了。

暂时就发现这点差异。