加载数据并预处理–创建分类器–训练分类器–在测试集上得到预测结果–计算准确率和召回率
import numpy
import pandas
from sklearn.metrics import classification_report#导入预测结果评估模块
from sklearn.model_selection import train_test_split,cross_val_score#导入自动生成训练集和测试集的模块
f = 'filepath'
data = pandas.read_csv(f+'data_train.txt',delimiter=' ',header=None)
X = data[list(range(10))]
y = data[10] #10折交叉验\
data_train = data.sample(frac=0.9)
data_test = data.iloc[list(set(data.index)-set(data_train.index))]
y_train = data_train[10]
x_train = data_train[list(range(10))]
y_test = data_test[10]
x_test = data_test[list(range(10))]
通过计算带分类的数据点,与已有训练集的中的所有数据点的距离,取最小的前K个点,根据‘’少数服从多数的原则‘’进行划分。
基本方法如下`。
from sklearn.neighbors import KNeighborsClassifier #导入K近邻分类器
KNN = KNeighborsClassifier().fit(x_train, y_train) # 使用KNN算法进行训练并生成预处理结果
test = pd.read_csv(f+'data_test.txt',delimiter=' ',header=None)
answer_knn = KNN.predict(test)
print('\n\nThe classification report for knn:')
np.savetxt('filepath+txtname.txt',answer_knn,fmt='%d',newline='\r\n')
一种树状结构的分类器,通过属性决定分类点的最终类别,通常根据特征的信息增益或其他指标,构建一颗决策树,分类时对节点进行依此判断,即可得到结果。
展示:
首先导入所需要的分类器
from sklearn.metrics import classification_report
from sklearn.tree import DecisionTreeClassifier #使用import语句导入决策树分类器
处理数据进行训练并预测
DTC = DecisionTreeClassifier(criterion='entropy').fit(x_train,y_train)
ans_DTC = DTC.predict(x_test)
print(classification_report(y_test,ans_DTC)) #采用全量数据训练模型并将预测结果输出
DTC = DecisionTreeClassifier(criterion='entropy').fit(X,y)
test = pd.read_csv(f+'data_test.txt',delimiter=' ',header=None)
ans = DTC.predict(test)
np.savetxt('filepath+txtname.txt',ans,fmt='%d',newline='\r\n')#产生的文件存放在打他文件夹中
以贝叶斯定理为基础的多分类的分类器,对于给定数据,首先基于特征的条件独立假设性假设,学习输入输出的联合概率分布,基于此模型,对于给定的输入x,利用贝叶斯定理求出后验概率最大的输出y
展示:
导入高斯分类器
from sklearn.naive_bayes import GaussianNB #高斯朴素贝叶斯函数
对数据进行训练
BYS = GaussianNB().fit(x_train, y_train) #使用贝叶斯算法进行训练
test = pd.read_csv(f+'data_test.txt',delimiter=' ',header=None)
answer_BYS = BYS.predict(test)
#对分类结果从 精确率precision 召回率recall f1值fl-score和支持度support四个维度进行衡量
print('\n\nThe classification report for Bayes:')
np.savetxt('filepath+txtname.txt',answer_BYS,fmt='%d',newline='\r\n')
VS2019配置opencv教程前言说明OpenCV配置步骤Visual Studio 2019 配置测试前言时间;2019-7-18环境:Visual Studio 2019,Windows,OpenCV 4.1.0说明也许读者也看过其他配置OpenCV的教程,但是创建的项目属性下面没有一个叫Microsoft.Cpp.x64.user的文件,这里我使用其他的方法配置。OpenCV配..._vs2019配置opencv
一、修改httpd.conf文件进入lampp/etc目录下,编辑httpd.conf文件。需要监听几个端口就写几个,注意系统得配置好这几个端口的访问权限再注释掉如下行这里的配置是apache默认的配置,当存在多站点时,这个默认的显然就不对了,否则就只能一直访问该站点。最后还有一个地方需要修改,如下图红框中的配置需要把注释解开,因为随后的多站点配置需要利用htt...
转载地址今天扣丁学堂给大家总结了一下解析Linux守护进程的介绍,首先说一下后台进程与守护进程的区别吧。一、后台进程与守护进程1、守护进程已经完全脱离终端控制台了,而后台程序并未完全脱离终端(在终端未关闭前还是会往终端输出结果);2、守护进程在关闭终端控制台时不会受影响,而后台程序会随用户退出而停止,需要在以nohup command &格式运行才能避免影响;3、守..._后台进程特点
一般批量修改MYSQL中某表的数据库引擎可以利用官方工具[mysql_convert_table_format](http://http://dev.mysql.com/doc/refman/5.1/en/mysql-convert-table-format.html)来实现, 这里指的是不使用其他工具仅用shell的方法来实现。(以下例子效果是将数据库`shop`中所有引擎不为InnoDB的表修..._将所有表改为indb
package com.inks.ink.UI;import android.app.Activity;import android.app.Application;import android.os.Bundle;import android.util.Log;import com.inks.inkslibrary.utils.L;import com.uuzuche.lib_z...
注意的开始两行的2个注解 @RunWith 和 @PrepareForTest@RunWith比较简单,后面始终是PowerMockRunner.class@PrepareForText后面需要加的是调用构造函数的类名,而不是有构造函数的类本身。在下面的例子中,我们要测试的类是:Helper, 在Helper类中调用了Somthing类的构造函数来创建实例。@RunWith_powermock 构造函数
目录LowMediumHighImpossibeLowphp源码包含的过滤代码如下从源代码可以看出,这里low级别的代码没有任何的保护性措施!html代码如下。页面本意是叫我们选择默认的语言,但是对default参数值没有进行任何的过滤,直接插入到option标签中。因为这段JS代码是本地执行的,获取本地输入的URL栏上的default参数再直接嵌入到option标签中的,因而可以直接往default参数注入XSS payload即可1. 利用尖括号构造弹..
本题采用递归程序的思想:#include<stdio.h>int way(int m,int n){if(n==1||m==0)return 1;if(n>m)return way(m,m);return way(m,n-1)+way(m-n,n);}int main(){int m,n,t;...
问题描述读取多个文件的内容,计算内容在那个文件有出现,并且计算其出现的次数(权重),如下:已有三个文件,其内容如下:经过处理,其处理结果如下:以第一行为例: 表示在file1.txt,file2.txt各包含1个 Hadoop。准备输入文件:上传到 hdfs://master:9000/data/indvertedIndex2:代码思路:在Mapper端:根据输入内...
论文:蹦极的数学建模及其龙格-库塔法求解方法在“华东师范大学首届研究生数学建模竞赛”中,获得二等奖。发表日期:2007年5月摘要:本文通过参照题中给出的数据,对蹦极者在蹦极过程受到重力,拉力,空气阻力等受力分析,依据牛顿第二定律,将这种现实生活中连续状态的非线性系统进行建模,得到一个完整的蹦极数学模型。该模型表现为蹦极者位置x对下落时间t的二阶常微分方程。然后利用Matlab编程,采用龙格-库...
卷首语统一的话语体系是进度管理专业人士沟通的基础。22、目标跟踪target tracking目标跟踪是指在机场工程总进度计划的执行过程中,通过跟踪项目的实施进展,比较进度计划值与实际值,对出现的进度偏差采取措施进行纠偏,使项目总进度目标得以实现的活动。23、动态控制dynamic control动态控制是指在机场工程的建设与运营筹备实施过程中,经常性地定期或不定期开展的目标跟踪活动。24、主动控制active control主动控制是指在机场工程的建设与运营筹备实施过程中,通过_oracle p6 思纬网络
异常处理:你不可能总是对的让编程改变世界Change the world by program因为我们是人,不是神,所以我们经常会犯错。当然程序员也不例外,就算是经验丰富的码农,也不能保证写出来的代码百分百没有任何问题。另外,作为一个合格的程序员,在编程的时候一定要意识到一点,就是永远不要相信你的用户。要把他们想象成熊孩子,把他们想象成黑客,这样你写出来的程序自然...