python3_sklearn(机器学习库)_tree_DecisionTreeClassifier_不同函数参数及使用说明_sklearn.tree decisiontreeclassifier-程序员宅基地

技术标签: fit  DecisionTreeClassifier  人工智能  sklearn  tree  # 机器学习【算法】  决策树  # Python 3.0  

 

sklearn是一个机器学习的第三方库,在整个库当中提供了非常多的算法,tree(分类决策树)模块就是其中之一。

1.DecisionTreeClassifier

DecisionTreeClassifier是我们通常所说的决策树分类器,它是一个继承于BaseDecisionTree和ClassifierMixin类的子类

函数名 功能
__init__ 决策树分类器构造函数(内部实现是通过调用父类DecisionTreeClassifier中的构造函数实现的)
fit  
predict_proba  
predict_log_proba  

(一)__init__()函数说明

# --------------------class DecisionClassifier: def __init__():---------------------------#
# --重要参数
# --criterion="gini":划分属性的选择标准 gini(基尼系数) entropy(信息增益)
# --splitter="best": 在节点中选择分类的策略。 best(最好的分类) random(最好的随机分类)
# --max_depth=None: 树最大深度。
# --min_samples_split=2: 区分一个内部节点需要的最少的样本数
# --min_samples_leaf=1: 叶子结点所需要的最小样本数
# --min_weight_fraction_leaf=0.:一个叶节点的输入样本所需要的最小的加权分数
# --max_features=None:分类时需要考虑的特征数
# --random_state=None: 随机数字发生器种子。(用来保证输出结果的唯一性)
# --max_leaf_nodes=None: 在最优方法中使用max_leaf_nodes构建一个树.(通常跟max_depth配合使用)
# --min_impurity_decrease=0.: 如果该分裂导致杂质的减少大于或等于该值,则将分裂节点
# --min_impurity_split=None: 节点停止分裂的阙值
# --class_weight=None:与标点中的类所关联的标签的权重
# --presort=False: 是否预先分配数据以加快拟合中最佳分裂的发现(小型数据集适合设置为True)

from sklearn.tree import DecisionTreeClassifier

tr = DecisionTreeClassifier(criterion="gini")

 

 

 

 

 

 

 

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/admin_maxin/article/details/81260947

智能推荐

动词后加to do 和 doing的记忆口诀_动词后加to do和doing-程序员宅基地

文章浏览阅读8.8w次,点赞25次,收藏51次。一、只能用动名词(ing)作宾语[口诀]考虑建议盼原谅,承认推迟没得想。避免错过继续练,否定完成停欣赏。禁止想象才冒险,不禁介意弃逃亡。consider考虑suggest建议/advocate 提倡主张look forward to 盼望forgive原谅/pardon 原谅acknowledge承认/admit 承认postpone延迟延期/delay 延迟/defer _动词后加to do和doing

beeline连接hive出错 Error: Could not open client transport with JDBC Uri_beeline could not open client transport with jdbc -程序员宅基地

文章浏览阅读1.9k次。出现的错误:Error: Could not open client transport with JDBC Uri: jdbc:hive2://NODE01:10000: Failed to open new session: java.lang.RuntimeException:org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.se..._beeline could not open client transport with jdbc uri: jdbc:hive2://10.1.0.7

【数据分析入门】python数据分析-统计学基础_pathon 基础和统计学基础-程序员宅基地

文章浏览阅读161次。统计学基础协方差定义在概率论和统计学中,协方差用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。期望值分别为E[X]与E[Y]的两个实随机变量X与Y之间的协方差Cov(X,Y)定义为:从直观上来看,协方差表示的是两个变量总体误差的期望。如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值时另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值;如果两个变量的变化趋势相反,即其中一个变量大于自身的期望值时另外一个却小于自身的期望值,那么两个变量_pathon 基础和统计学基础

Object.defineProperty()详解_objectdefineproperty,有哪些参数-程序员宅基地

文章浏览阅读298次。出处https://www.cnblogs.com/junjun-001/p/11761252.html#commentform或者https://www.cnblogs.com/ldq678/p/13854113.html  假设我们有个对象 user ; 我们要给它增加一个属性 name , 我们会这么做  1 var user = {};2 user.name="狂奔的蜗牛";3 console.log(user);//{name: "狂奔的蜗牛"}  如果想要增加一个sa..._objectdefineproperty,有哪些参数

springboot集成PageHelper,支持springboot2.0以上版本-程序员宅基地

文章浏览阅读1k次。第一步:pom文件还是需要引入依赖<!--mybatis的分页插件--> <dependency> <groupId>com.github.pagehelper</groupId> <artifactId>pagehelper-spring-boot-start..._springboot版本号2.6.2 用哪个版本的pagehelper

EDM信号分析_emd_visu出来的三张图的含义-程序员宅基地

文章浏览阅读1k次。EDM工具箱Imf=emd(X); X为需要分析的信号的时间序列Emd_visu(X,t,imf); 可视化操作, X为需要分析的信号的时间序列,t为时间的序列,imf为上一步生成的图一是结果 residue是趋势项;图二、图三两个是重构原信号的方式,就是把细节一点一点加上去和把趋势一点一点加上去功率谱、频率图选择需要分析的imf序列[Pxx,F] = pwelch(imf(2..._emd_visu出来的三张图的含义

随便推点

一步一步学linux操作系统: 11 进程数据结构_task_struct字段_内核栈_task_struct 内核栈-程序员宅基地

文章浏览阅读1k次。进程数据结构,task_struct字段,内核栈_task_struct 内核栈

mysql btree脚本_MySQL索引简述--BTree索引-程序员宅基地

文章浏览阅读124次。MySQL数据库有如下几种常见的索引类型:BTree索引哈希索引全文索引索引的本质MySQL官方对索引的定义为:索引(Index)是帮助MySQL高效获取数据的数据结构。提取句子主干,就可以得到索引的本质:索引是数据结构。最基本的查询算法当然是顺序查找(linear search),这种复杂度为O(n)的算法在数据量很大时显然是糟糕的,好在计算机科学的发展提供了很多更优秀的查找算法,例如二分查找(..._mysql使用b-tree作为索引方式,这种树的查找算法复杂度为对数级别

常见Web十大漏洞,常见Web漏洞_十大常见web漏洞-程序员宅基地

文章浏览阅读4.5k次,点赞10次,收藏42次。参考:https://blog.csdn.net/weixin_43376075/article/details/105189017https://blog.csdn.net/qq_43168364/article/details/105595532https://www.cnblogs.com/-qing-/p/10819069.html代码执行函数:1- eval()#传入的参数必须为PHP代码,既需要以分号结尾。比如从指定URL地址获取网页文本内容,加载指 定地址的图片,下载等等。_十大常见web漏洞

mat opencv 矩形roi_如何用opencv实现感兴趣区域ROI的选取-程序员宅基地

文章浏览阅读527次。OpenCV中感兴趣区域的选取与检测感兴趣区域(Region of Interest, ROI)的选取,一般有两种情形:1)已知ROI在图像中的位置;2)ROI在图像中的位置未知。1)第一种情形 很简单,根据ROI的坐标直接从原图抠出,不过前提是要知道其坐标,直接上例子吧。int getROI(Mat image, Rect rect){Mat img=image.clone();Mat roi;..._mat roi = img(rect);

计算机毕业设计开题报告遇到问题及解决办法(建议收藏)_计算机开题报告拟解决的关键问题有哪些-程序员宅基地

文章浏览阅读9.4k次,点赞13次,收藏87次。(1)用户信息管理:如果该用户没有注册过该网站,要先注册一个新的账户,然后在登录,如果一个用户他已经在这个网站上注册过自己的信息,就可以直接用自己的已经有的账户和自己已经设定好的密码进行登陆,在成功登陆首页以后就可以对自己的信息进行想要的修改,如:用户名、密码、真实的姓名、地址手机、Email、qq等信息,用户可以选择修改一个信息,也可以修改多个信息,修改完成以后点击保存,就可以修改成功了。(1)数据库的设计与建立:数据库的建立是一个很重要的步骤,它关乎网站能不能顺利进行,数据可以在设计网站的时候完善;_计算机开题报告拟解决的关键问题有哪些

Jenkins配置邮件发送_jenkins使用变量发email-程序员宅基地

文章浏览阅读2.3k次,点赞2次,收藏4次。Jenkins如何自动将构建结果通过邮件发给用户_jenkins使用变量发email

推荐文章

热门文章

相关标签