关于特征抽取的简单介绍简单来说:特征抽取就是把一些词语组合变换提取成为一个新的特征,这些原词汇映射到新特征上。而特征选择:就是从原来的特征集合中根据某种方法原则选择出一系列特征。本特征选择对文本内容的过滤和分类、聚类处理、自动摘要以及用户兴趣模式发现、知识发现等有关方面的研究都有... 全文

2016-06-25 23:59 来自版块 - 自然语言处理

关于条件随机场的简单理解 作者zack关于条件随机场的简单理解:简单解释总的来说:Hmm只考虑前一个词和对应概率矩阵的转移概率。CFR考虑更多,例如当前词长度对应的词性概率,当前词位置对应的词性概率等。对于词性标注而言:例如词性标注 首先有一个统计好的标注集,通过对标注集的统计... 全文

2016-06-25 23:59 来自版块 - 自然语言处理

先定义一些字母的含义:文档集合D,topic集合TD中每个文档d看作一个单词序列< w1,w2,…,wn >,wi表示第i个单词,设d有n个单词。(LDA里面称之为word bag,实际上每个单词的出现位置对LDA算法无影响)D中涉及的所有不同单词组成一个大集合VOC... 全文

2016-06-19 12:54 来自版块 - 自然语言处理

[附件]coursera 上机器学习课程笔记

2016-06-19 12:13 来自版块 - 机器学习

深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。[1]

2016-06-19 10:51 来自版块 - 深度学习

python 自然语言处理[附件]

2016-06-19 10:48 来自版块 - 自然语言处理

机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论凸分析算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

2016-06-19 10:31 来自版块 - 机器学习

用户态协议栈相关资料[附件]

2016-06-18 14:44 来自版块 - 安全网关开发

http://www.roe.ch/SSLsplit在网关设备中,我们在数据平台可以使用dpdk, pf-ring, netmap之类快速收包技术来实现 高性能, 但是sslsplit可以作为原型开发时研证用。

2016-06-18 08:34 来自版块 - 安全网关开发

DPDK 开发手册,中文部分翻译

2016-06-14 14:59 来自版块 - 安全网关开发

目前商业界使用的都是dual fcb方式,独立fsd,更好的兼容性和稳定性。

2016-06-14 13:46 来自版块 - 文件系统(过滤)驱动程序开发

如果你登录发现自己被禁言了,原因是因为密码太简单导致被用来发垃圾帖子。我们对于发送垃圾贴子的贴一律禁言处理,防止恶意灌水。 如果你发现被禁言,请联系管理员处理:QQ 364479email: znsoft@... 全文

2016-01-19 13:55 来自版块 - 疯狂灌水&& 人生 &&娱乐

最近来访

(16)

返回顶部