monkeyy
驱动中牛
驱动中牛
  • 注册日期2001-12-06
  • 最后登录2010-10-10
  • 粉丝0
  • 关注0
  • 积分315分
  • 威望84点
  • 贡献值0点
  • 好评度32点
  • 原创分0分
  • 专家分0分
阅读:3494回复:14

关于内容过滤的算法问题(400分)!

楼主#
更多 发布于:2003-11-09 15:34
反正绝对不可能使用strcmp这个东西来做,如果是的话,估计大量的CPU都被他占用了,有谁能介绍一个算法吗? :P

最新喜欢:

David_211David_...
听说老虎会吃人,所以从没想过去摸老虎的屁股。:( :(
wuhuaqiang
驱动牛犊
驱动牛犊
  • 注册日期2002-03-21
  • 最后登录2007-02-05
  • 粉丝0
  • 关注0
  • 积分50分
  • 威望6点
  • 贡献值0点
  • 好评度4点
  • 原创分0分
  • 专家分0分
沙发#
发布于:2003-11-11 14:42
这里如何,大量模式匹配算法都有。
http://www-igm.univ-mlv.fr/~lecroq/string/node1.html

[编辑 -  11/11/03 by  wuhuaqiang]
我实话告诉你们,我可是身经百战了。bbs我见的多了,哪个版我没灌过?你们要知道,smth的thupress版,那比你们不知道厉害到哪里去了,我在那谈笑风声.你们有一个好,就是无论在哪个版,什么话题都灌,但是灌来灌去的问题,都too simple,sometimes naive!你们懂不懂呀?啊?所以说灌水啊,关键是要提高自己的知识水平。你们啊,不要总想着弄个大坑,然后灌上十大,再把我羞辱一番……你们啊,naive !你们这样灌是不行地!
monkeyy
驱动中牛
驱动中牛
  • 注册日期2001-12-06
  • 最后登录2010-10-10
  • 粉丝0
  • 关注0
  • 积分315分
  • 威望84点
  • 贡献值0点
  • 好评度32点
  • 原创分0分
  • 专家分0分
板凳#
发布于:2003-11-17 18:22
谢谢,前阵子有点忙,一直没来看!
兄弟,再等等别人看说说点什么吧!

听说老虎会吃人,所以从没想过去摸老虎的屁股。:( :(
mars14
驱动牛犊
驱动牛犊
  • 注册日期2004-06-09
  • 最后登录2004-06-09
  • 粉丝0
  • 关注0
  • 积分0分
  • 威望0点
  • 贡献值0点
  • 好评度0点
  • 原创分0分
  • 专家分0分
地板#
发布于:2004-06-09 15:29
期待看到这个问题解决,所以顶一下
canoe982
驱动牛犊
驱动牛犊
  • 注册日期2003-04-11
  • 最后登录2005-12-14
  • 粉丝0
  • 关注0
  • 积分0分
  • 威望0点
  • 贡献值0点
  • 好评度0点
  • 原创分0分
  • 专家分0分
地下室#
发布于:2004-06-10 07:34
我也觉得模式匹配比较好。最好是找一些专门介绍算法的书来看看,要自己搞出一套好的算法来,恐怕不那么容易。
独怜幽草涧边生, 上有黄鹂深树鸣。 春潮带雨晚来急, 野渡无人舟自横。
walkonthesky
驱动中牛
驱动中牛
  • 注册日期2003-11-26
  • 最后登录2012-11-06
  • 粉丝0
  • 关注0
  • 积分1分
  • 威望20点
  • 贡献值0点
  • 好评度0点
  • 原创分0分
  • 专家分0分
5楼#
发布于:2004-06-14 14:52
感觉没有特别好的算法来实现
分词、语意识别、一词多意、语境分析,反正问题多了。
传说中才有的完美算法。
[img]http://www.driverdevelop.com/forum/upload/walkonthesky/2004-07-08_2004-07-07_b847.gif[/img]
joeda
驱动牛犊
驱动牛犊
  • 注册日期2004-01-08
  • 最后登录2004-06-19
  • 粉丝0
  • 关注0
  • 积分0分
  • 威望0点
  • 贡献值0点
  • 好评度0点
  • 原创分0分
  • 专家分0分
6楼#
发布于:2004-06-19 13:23
可以考虑先归类 再去匹配  :D
liwashington
驱动小牛
驱动小牛
  • 注册日期2004-04-30
  • 最后登录2010-10-21
  • 粉丝0
  • 关注0
  • 积分-11分
  • 威望98点
  • 贡献值1点
  • 好评度12点
  • 原创分0分
  • 专家分0分
7楼#
发布于:2004-07-29 09:28
主要取决于你要过滤的内容,在一大堆内容中查找一小块内容模式匹配确是不错的算法,如果是比较两个串一类的过滤也可以使用hash算法嘛,算出两个串的hash值再比较两个数,有很多时候这就可以达到目的了.
我只想有个好老婆,每天有几顿好饭吃……
RED_spring
驱动中牛
驱动中牛
  • 注册日期2002-07-28
  • 最后登录2016-11-06
  • 粉丝0
  • 关注0
  • 积分3分
  • 威望19点
  • 贡献值0点
  • 好评度17点
  • 原创分0分
  • 专家分0分
  • 社区居民
8楼#
发布于:2004-08-04 20:39
有没有例子?
RED_spring
驱动中牛
驱动中牛
  • 注册日期2002-07-28
  • 最后登录2016-11-06
  • 粉丝0
  • 关注0
  • 积分3分
  • 威望19点
  • 贡献值0点
  • 好评度17点
  • 原创分0分
  • 专家分0分
  • 社区居民
9楼#
发布于:2004-08-04 20:40
主要取决于你要过滤的内容,在一大堆内容中查找一小块内容模式匹配确是不错的算法,如果是比较两个串一类的过滤也可以使用hash算法嘛,算出两个串的hash值再比较两个数,有很多时候这就可以达到目的了.


有没有例子?   :)
liusz
驱动牛犊
驱动牛犊
  • 注册日期2004-03-16
  • 最后登录2018-05-26
  • 粉丝0
  • 关注0
  • 积分29分
  • 威望43点
  • 贡献值0点
  • 好评度2点
  • 原创分0分
  • 专家分0分
10楼#
发布于:2004-08-14 12:16

能不能个例子 看看啊,虽然看了有穷状态自动机什么的模式匹配理论,可是自己不知道怎么写啊。

给个例子吧。分数我也有 ,可以给的。
liusz
驱动牛犊
驱动牛犊
  • 注册日期2004-03-16
  • 最后登录2018-05-26
  • 粉丝0
  • 关注0
  • 积分29分
  • 威望43点
  • 贡献值0点
  • 好评度2点
  • 原创分0分
  • 专家分0分
11楼#
发布于:2004-09-17 16:46

各位帮着看看到底用什么搜索算法好:

我要对每一个明文的文本数据包做实时搜索,关键词假如是200个,知识不知道用什么搜索算法才合适?

该不会是200次搜索吧?有穷状态自动机可以吗?可是还真不知道有穷状态自动机的算法怎么写  :(   请大家给参谋参谋。
AllenZh
驱动老牛
驱动老牛
  • 注册日期2001-08-19
  • 最后登录2015-11-27
  • 粉丝19
  • 关注10
  • 积分1316分
  • 威望2387点
  • 贡献值7点
  • 好评度321点
  • 原创分0分
  • 专家分0分
12楼#
发布于:2004-09-26 16:32
谢谢,前阵子有点忙,一直没来看!
兄弟,再等等别人看说说点什么吧!

 

真是皇上不急,太监急 :D
1,承接Windows下驱动/应用开发 2,本人原创虚拟鼠标/键盘,触摸屏,虚拟显卡,Mirror驱动,XP无盘的SCSI虚拟磁盘驱动等 3,windows下有尝技术服务(包括BUG调试,员工培训等) 欢迎深圳和海外企业联系.msn:mfczmh@sina.com
cuteobob
驱动牛犊
驱动牛犊
  • 注册日期2003-03-20
  • 最后登录2008-08-21
  • 粉丝0
  • 关注0
  • 积分30分
  • 威望4点
  • 贡献值0点
  • 好评度4点
  • 原创分0分
  • 专家分0分
13楼#
发布于:2005-01-31 03:12
用单模或多模自动机进行匹配不就可以了,这类的文章计算机学报上有一些,可以找到的。
paladinii
驱动中牛
驱动中牛
  • 注册日期2003-10-28
  • 最后登录2012-03-09
  • 粉丝0
  • 关注0
  • 积分282分
  • 威望74点
  • 贡献值0点
  • 好评度23点
  • 原创分0分
  • 专家分0分
14楼#
发布于:2005-02-07 15:17
 
单模或多模自动机

能否详细说说?
Ideas for life!
游客

返回顶部