分类 经验

朴素分类 1.1、摘要 分类是一类分类算法的总称,这类算法均以定理为基础,故统称为分类。本文作为分类算法的第一篇,将首先介绍分类问题,对分类问题进行一 个正式的定义。然后,

jopen 2015-02-02   58580   0

用Python编写的反垃圾邮件分类:antispam 经验

antispam是用Python编写的反垃圾邮件分类。 PyPI: pypi.python.org/pypi/antispam Docs: antispam.readthedocs.org Installation

jopen 2015-12-13   24164   0

学习举例--学习分类文本 经验

档中自动过滤出最相关的文档显示给读者。 这里描述了一个基于朴素分类器的文本分类的通用算法。 将要展示的朴素算法遵循以下的问题背景: 1、考虑实例空间 X 包含了所有的文

jopen 2016-01-18   21458   0

朴素分类器的应用 资讯

生活中很多场合需要用到分类,比如新闻分类、病人分类等等。 本文介绍 朴素分类器 (Naive Bayes classifier),它是一种简单有效的常用分类算法。 一、病人分类的例子 让

jopen 2013-12-16   13239   0

应用朴素分类器对文本简单分类 经验

朴素分类器 一,生成词向量(词集模型) 第一,假设这里有两个参数 vocabList , inputSet 。 vocabList 代表着包含很多无重复的词,词量足够大, inputSet

jopen 2015-12-29   23711   0
P38

  第3讲 统计分类(一)--分类 文档

模式识别第三讲 统计模式识别(一) --分类方法数理统计基础 分类的基本原理 最小错误率分类 最小风险分类 最大似然比分类 2. 1、全概率公式和公式 (1)条件概率: 设A、B是两个事件,且P(B)>0,则称

jingbo158 2014-04-24   573   0

自己动手写分类器给图书分类 经验

开始分享解决方案,包括某些优化方案。 从问题开始 我们要解决的问题,是 对图书进行二元分类分类的依据是 图书的tag 。这些tag可能来自专家,或者编辑,或者用户。例如“外国文学”,“侦探

jopen 2015-07-23   26185   0

斯文本分类 经验

1 、基本定义: 分类是把一个事物分到某个类别中。一个事物具有很多属性,我们可以把它的众多属性转化为向量表示形式,即 x=(x1,x2,x3,…,xn) ,分别代表每个实例有n个属性值 , 实例的集合

jopen 2015-10-09   8733   0

用scikit-learn实现朴素分类 经验

朴素(Naive Bayes Classifier)是一种「天真」的算法(假定所有特征发生概率是独立的),同时也是一种简单有效的常用分类算法。关于它的原理,参见 朴素分类器的应用 。 scikit-learn

jopen 2015-01-10   47637   0
P6

  基于信息几何构建朴素分类 文档

基于信息几何构建朴素分类器 基于信息几何构建朴素分类器 黄友平黄友平,男,博士研究生,主要研究方向为Bayesian网络、信息几何。E-mail: huangyp@ics.ict.ac.cn

likfefe 2016-01-14   2413   0

Python下开源可持久化朴素分类库:simplebayes 经验

simplebayes是Python下开源可持久化朴素分类库。 This work is heavily inspired by the python "redisbayes" module found

jopen 2015-03-31   29709   0

数据挖掘(8):朴素分类算法原理与实践 经验

隔了很久没有写数据挖掘系列的文章了,今天介绍一下朴素分类算法,讲一下基本原理,再以文本分类实践。 一个简单的例子 朴素算法是一个典型的统计学习方法,主要理论基础就是一个公式,公式的基本定义如下:

jopen 2015-08-31   39955   0

算法杂货铺:分类算法之朴素分类(Naive Bayesian classification) 经验

、二叉树、查找、排序等任何一本数据结构教科书都会讲的基础内容,我会从一个“专题”出发,如概率算法、分类算法、NP问题、遗传算法等,然后做一个引申,可能会涉及到算法与数据结构、离散数学、概率论、统计学、

ygw3 2015-05-08   21008   0
算法  

朴素算法的python实现 代码段

朴素 比如我们想判断一个邮件是不是垃圾邮件,那么我们知道的是这个邮件中的词的分布,那么我们还要知道:垃圾邮件中某些词的出现是多少,就可以利用定理得到。 朴素分类器中的一个假设是:每个特征同等重要

wcwx 2015-01-03   1603   0
算法  
P37

  Tom机器学习 第6章-学习 文档

第6章  学习 推理提供了推理的一种概率手段。它基于如下的假定,即待考查的量遵循某概率分布,且可根据这些概率及已观察到的数据进行推理,以作出最优的决策。推理对机器学习十分重要,因为

jiavaz 2012-06-26   846   0

推断及其互联网应用(二) 资讯

上一次,我介绍了推断的 原理 ,今天讲如何将它用于垃圾邮件过滤。 ======================================== 推断及其互联网应用 作者:阮一峰

码头工人 2011-08-27   25273   0

方便好用的(Python)优化库Spearmint 经验

方便好用的(Python)优化库Spearmint。 Spearmint is a software package to perform Bayesian optimization. The

n6bg 2015-05-01   29155   0

学习--极大后验假设学习 经验

〉是固定不变的,因此 训练数据 D 可被简单地写作目标函数值序列: D =〈 d 1 … d m 〉。 基于理论我们可以设计一个简单的算法输出最大后验假设 Brute-ForceMAP学习算法 1.对于

jopen 2016-01-18   14785   0

推断及其互联网应用(一) 资讯

。 那本书大部分谈的是技术哲学,但是第八章却写了一个非常具体的技术问题----如何使用推断过滤垃圾邮件( 英文版 )? 说实话,我没完全看懂那一章。那时,交稿截止日期已经过了,没时间留给我

码头工人 2011-08-27   24953   0

Bayesian-belief-networks:优雅的信念网络框架 经验

Bayesian-belief-networks允许你用纯Python创建信念网络和其他图模型,目前支持四种不同的推理方法。 支持的图模型 离散变量的信念网络 有着高斯分布的连续变量的高斯网络 推理引擎 消息传递和联合树算法(Junction

jopen 2015-01-07   29199   0
1 2 3 4 5 6 7 8 9 10