注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

Nofear的游戏理论研究

 
 
 

日志

 
 
关于我

虚拟世界架构师

网易考拉推荐

一个无聊的设想:做一个可以判断论坛马甲是谁的软件  

2007-07-26 02:13:57|  分类: 默认分类 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

  突然有个无聊的想法:做一个可以判断论坛马甲是谁的软件。其实是先有思路再有想法的。

  我有个同事,常常很自信的说:XXX是XXX的马甲。问为什么,他说语感一致。语感,多虚无缥缈的词啊!至少我判断不出。有没有什么算法可以判断语感呢?

  早先看到有一篇关于google的文章,说google如何判断两篇不同的文章说的是同一件事。google把每个词都当作一个向量,向量是可以相加的,那么一篇文章的所有的词相加向量是确定的,于是看两篇文章的向量的夹角是多少,来看它们的相似程度是多少。用这个方法也可以判断一段文字有多大可能是某个人写的。

  如果做得更好一点,把文章中所有内容相关的词都去掉,只剩下逻辑和语气相关的词,然后再判断。因为说的内容会变,但是一个人的语气不容易变,一个人的逻辑更不容易变。

  再做得好一点,可以把一些同义词关联起来,比如有的人习惯说“如果”,他故意改变习惯改用“假如”,软件仍然判断它们的相关性很大。

  如果做的马虎一点,统计词频也行……

  PS.这个方法其实也能用于其它研究,比如研究休闲游戏玩家用词和MMORPG玩家用词差别有多大。

  评论这张
 
阅读(183)| 评论(1)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017