【人工智能项目】LSTM实现电影评论情感分类实验_堆栈lstm情感分析-程序员宅基地

【人工智能项目】LSTM实现电影评论情感分类实验

本次对电影评论的情感进行分析，看是否为积极评论还是消极评论。
在这里插入图片描述

本次所用数据集

import os

data_dir = "./Dataset"
print(os.listdir(data_dir))

['test.txt', 'train.txt', 'validation.txt', 'wiki_word2vec_50.bin']

导包

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import os
import time
import datetime

from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder
from sklearn.utils import class_weight as cw

from keras import Sequential

from keras.models import Model

from keras.layers import LSTM,Activation,Dense,Dropout,Input,Embedding,BatchNormalization,Add,concatenate,Flatten
from keras.layers import Conv1D,Conv2D,Convolution1D,MaxPool1D,SeparableConv1D,SpatialDropout1D,GlobalAvgPool1D,GlobalMaxPool1D,GlobalMaxPooling1D
from keras.layers.pooling import _GlobalPooling1D
from keras.layers import MaxPooling2D,GlobalMaxPooling2D,GlobalAveragePooling2D

from keras.optimizers import RMSprop,Adam

from keras.preprocessing.text import Tokenizer
from keras.preprocessing import sequence

from keras.utils import to_categorical

from keras.callbacks import EarlyStopping
from keras.callbacks import ModelCheckpoint
from keras.callbacks import ReduceLROnPlateau

%matplotlib inline

import warnings
warnings.filterwarnings("ignore")

Using TensorFlow backend.

导入数据

train_df = pd.read_csv("./Dataset/train.txt",encoding="utf-8",header=None,sep="\t",names=["label","text"])
valid_df = pd.read_csv("./Dataset/validation.txt",encoding="utf-8",header=None,sep="\t",names=["label","text"])
test_df = pd.read_csv("./Dataset/test.txt",encoding="utf-8",header=None,sep="\t",names=["label","text"])

train_df

	label	text
0	1	死囚爱刽子手女贼爱衙役我们爱你们难道还有别的选择没想到胡军除了...
1	1	其实我对锦衣卫爱情很萌因为很言情小说可惜女主角我要不是这样被乔...
2	1	两星半小明星本色出演老演员自己发挥基本上王力宏表演指导上没有 ...
3	1	神马狗血编剧神马垃圾导演女猪脚无胸无人胃口一干男猪脚基情四射...
4	1	Feb 半顆星我們家說這是一部從開始第十二分鐘我開始打哈欠一直 ...
...	...	...
19993	0	齐齐像一幅油彩色彩绚烂青春斑斓栗子姐姐女神般的存在多少女孩幻想...
19994	0	使我想起多年前看精武英雄叙事按部就班打斗倒精彩刺激也颇能安...
19995	0	看之前豆瓣上看到一个评论说要找到自己看这部电影哭泣原因我想...
19996	0	假如影片大前提逻辑完全成立那么影片前后呼应节奏情节主题简直完美 ...
19997	0	一种浪漫能让美女感动两种浪漫却能让美女不知所措房子车子足以让...

19998 rows × 2 columns

# 重新排序
train_df = train_df.sample(frac=1).reset_index(drop=True)

train_df

	label	text
0	0	一直一来我认为最好电影之一基本上一段时间翻出来看一遍感动那么多人...
1	0	哭很感触鬼经历真的好像好像虽然最后回到现实但是他们精神留下鬼...
2	0	依旧不用看前部能看懂美式剧情特效制作相当精细阿汤哥迪拜一系列 ...
3	0	好电影不需要大成本好电影只需要打动你一点东西很喜欢这样大家...
4	1	王宝强农民但这部戏里不是傻根为什么非要演跟年代傻根一样你见过...
...	...	...
19993	0	不管别人怎么样抨击我心里这是一部好电影爱恨感觉情到深处贝尔演...
19994	0	一部故事情节太完整主题太直接有点脱离新海诚以往风格中间部分感觉...
19995	1	其实世界上本没有火星男女人普遍认可并接受花心不负责任只用下半身 ...
19996	0	成龙终于一部没有成龙风格电影尔冬升用很重力直面人性贪婪生存面...
19997	1	一部完全扯淡 B 级片唯一让我提起精神那个硕大毛爷爷头像好我准...

19998 rows × 2 columns

valid_df

	label	text
0	1	台湾导演执导林志玲一人分饰两角扮演一对双胞胎姐妹廖凡陈坤杨佑宁出演...
1	1	我一向主张文艺片商业片区别对待需要用不同标准来衡量英雄无极我认...
2	1	比较失望本以为冯是国内导演中最会讲故事一个结果中途因为吃太饱 ...
3	1	改编很失败把莎老公改成个中年带儿子大叔给两人美好结局本书本...
4	1	剧情一直没看懂看到一半时女友旁笑说演电影疯子看电影傻子老实...
...	...	...
5624	0	看不懂棒球规则以及数据理论情况下仍然交杂激动播报连胜结果眼眶皮...
5625	0	笑點還挺多但又不是無厘頭那種不知所謂戲中四個故事還挺有意思至於...
5626	0	其实电视剧比电影版不知道强多少倍起码王珞丹很适合杜拉拉这个角...
5627	0	这是一部给后看片子对于整日大城市里工作奔波还要担心明儿会不会...
5628	0	出电影前看那个 MV 万分期待觉得女生太帅气可是看又觉得好像没...

5629 rows × 2 columns

# 重新排序
valid_df = valid_df.sample(frac=1).reset_index(drop=True)

valid_df

	label	text
0	0	真的很搞笑虽然很多场景比较暴露比较赤裸裸但是看时候完全没有觉得...
1	0	好看不是净追求大场面古装片更多桌子底下暗流涌动那根弦时时令人...
2	0	值得一看印度贫民窟种种感情面对生活不同抉择随着一个个问题慢慢展现 ...
3	1	分钟其实剪辑版剧情节奏这么莫名其妙不要以为结局其他人全灭两个男人 ...
4	1	片子看得我直起鸡皮疙瘩那群多毛强壮未开化猩猩竟然比人类还要聪明 ...
...	...	...
5624	0	经典台词地球上热带雨林目前正以每秒钟相当于两个场速度消失造成每天 ...
5625	0	以小说改编不管十三钗这事真是假我们南京城三十万同胞确是真真实实牺...
5626	0	一切淡淡的爱无奈滔滔巨浪般对金鱼公主爱恋之后宫崎爷爷转而描画 ...
5627	0	如果说四奶奶大奶奶天生敌人那么柴九就是天生知己他们之间应该不...
5628	1	天天里出现每个演员当电影好不好先不说做法让人反感到作呕本来想...

5629 rows × 2 columns

test_df

	label	text
0	1	如果我无聊时网上乱逛偶尔看到这部电影我可能会给它打四星但是...
1	1	服装很漂亮场景很大气演员演得也不错特技效果也非常精彩魔幻味够...
2	1	冯小刚越来越会摸国人卖搞人还有很多傻跟着转个人认为完全个喜...
3	1	该剧还是正老问题就是痕迹过重宫廷剧是最受观众欢迎所以人人来拍...
4	1	戏不够误会凑戏不够人妖凑戏不够卧底凑戏不够寻宝凑戏不够野...
...	...	...
364	0	像多年前朋友說一樣法國人浪漫總讓人覺他們心裡綻滿花如果每天 ...
365	0	看这部片子时候我一直想这种影片属于什么类型影片开始部分普通人 ...
366	0	阿娇从啥子时候那么漂亮演技也好看来就是要赤裸裸经历才真的体验 ...
367	0	没有华丽镜头或者刻意营造小清新就是普普通通台湾巷子简简单单中学教...
368	0	我从来不认为个人应当集体社会而赎罪你可以说没有个人忏悔没有集...

369 rows × 2 columns

# 重新排序
test_df = test_df.sample(frac=1).reset_index(drop=True)

test_df

	label	text
0	0	原来这部戏黑暗对观看者精神摧残逼迫我们去思考科技网络技术发展...
1	1	实在不明白就是他们说非常感人电影任何情节上硬伤或者我认为硬伤...
2	1	残不忍睹看个开头实在坚持不了精虫吃光他们大脑东京热正式后新...
3	0	未来房屋架构思想不管动画还是真人电影想要表现这种温情手段并不 ...
4	1	对维多利亚爱情萌生过渡太硬她动人处究竟一度产生这样感觉吸引基努...
...	...	...
364	0	当人落魄时候检验一个人真正时刻兄弟情义男人与男人之间对决能屈能...
365	1	刘导拍这个您就是晚节不保就算看看后面那些乱七八糟差一杠子人我恶...
366	1	祢丫昰就算讓我淚撒奧斯卡祢也昰部爛片前半部男人拯救苦海小三...
367	0	很经典恐怖片结局很出乎意料我看好几遍发现不少感人地方也去思考 ...
368	0	我唯一愿意给满分片子诺兰片子虽然很主观但是我喜欢他叙事喜欢 ...

369 rows × 2 columns

print(train_df.shape,valid_df.shape,test_df.shape)

(19998, 2) (5629, 2) (369, 2)

valid_df = pd.concat([valid_df,test_df[:50]],axis=0)

# 合并
train_df = pd.concat([train_df,valid_df],axis=0)
print(train_df.shape)

(25677, 2)

# 统计一下
sns.countplot(train_df["label"])
plt.title("Number of ham and spam messages")
plt.xlabel("Label")

Text(0.5, 0, 'Label')

在这里插入图片描述

标签数据处理

# 对标签进行处理
#  LabelEncoder 是对不连续的数字或者文本进行编号
# LabelEncoder可以将标签分配一个0—n_classes-1之间的编码

x_train = train_df["text"]
y_train = train_df["label"]


le = LabelEncoder()
y_train = le.fit_transform(y_train)
y_train = y_train.reshape(-1,1)

文本数据处理

# 分词器Tokenizer   Tokenizer是一个用于向量化文本，或将文本转换为序列（即单词在字典中的下标构成的列表，从1算起）的类
       # 类方法
           # fit_on_texts(texts) :texts用于训练的文本列表
          # texts_to_sequences(texts):texts待转为序列的文本列表 返回值:序列的列表，列表中的每个序列对应于一段输入文本

# 填充序列pad_sequences  将长为nb_smaples的序列转换为(nb_samples,nb_timesteps)2Dnumpy attay.如果提供maxlen,nb_timesteps=maxlen,
#否则其值为最长序列的长度。
# 其它短于该长度的序列都会在后部填充0以达到该长度。长与nb_timesteps的序列会被阶段，以使其匹配该目标长度。

#max_words = 1000
#max_len = 150
max_words = len(set(" ".join(x_train).split()))
max_len = x_train.apply(lambda x:len(x)).max()


tok = Tokenizer(num_words=max_words)

tok.fit_on_texts(x_train)

sequences = tok.texts_to_sequences(x_train)
sequences_matrix = sequence.pad_sequences(sequences,maxlen=max_len)

ModelCheckpoint：
- 作用：该回调函数将在每个epoch后保存模型到filepath
- 参数：
  - filename:字符串，保存模型的路径，filepath可以是格式化的字符串，里面的
  - monitor:需要监视的值，通常为:val_acc或val_loss或acc或loss
  - verbose:信息展示模型，0或1。默认为0表示不输出该信息，为1表示输出epoch模型保存信息。
  - save_best_only:当设置为Trur时，将只保存在验证集上性能最好的模型
  - mode:“auto”,“min”,"max"之一，在save_best_only=True时决定性能最佳模型的评判准则。
  - save_weights_only:若设置为True时，则只保存模型权重，否则将保存整个模型（包括模型结构，配置信息等）
  - period:CheckPoint之间的间隔的epoch数
EarlyStopping：
- 作用：当监测值不再改善时，该回调函数将中止训练
- 参数：
  - monitor:需要监视的量，通常为val_acc或val_loss或acc或loss
  - patience:当early stop被激活（如发现loss相比上patience个epoch训练没有下降），则经过patience个epoch后停止训练。
  - verbose:信息展示模型
  - mode:“auto”,“min”,"max"之一，在min模式下，如果检测值停止下降则中止训练。在max模式下，当检测值不再上升则停止训练。
ReduceLROnPlateau:
- 作用：当评价指标不再提升时，减少学习率。当学习停滞时，减少2倍或10倍的学习率通常能够获得较好的效果。该回调函数检测指标的情况，如果在patience个epoch中看不到模型性能提升，则减少学习率。
- 参数：
  - monitor:被监测的量
  - factor:每次减少学习率的因子，学习率将以lr=lr*factor的形式被技术那好
  - patience：当patience个epoch过去而模型性能不提升时，学习率减少的动作会被触发
  - mode:“auto”,“min”,"max"之一，在min模式下，如果检测值触发学习率减少。在max模式下，当检测值不再上升则触发学习率减少
  - epsilon:阈值，用来确定是否进入检测值的“平原区”
  - cooldown:学习率减少后，会经过cooldown个epoch才重新进行正常操作
  - min_lr:学习率的下限。

print("Setting Callbacks")

checkpoint = ModelCheckpoint("model.h5",
                                                     monitor="val_acc",
                                                     verbose=1,
                                                     save_best_only=True,
                                                     mode="max")

early_stopping = EarlyStopping(monitor="val_loss",
                                                     patience=3,
                                                     verbose=1,
                                                     restore_best_weights=True,
                                                     mode="min")

reduce_lr = ReduceLROnPlateau(monitor="val_loss",
                                                      factor=0.5,
                                                      patience=2,
                                                      verbose=1,
                                                      mode="min")

callbacks=[checkpoint,early_stopping,reduce_lr]

Setting Callbacks

定义深度学习模型

# 定义RNN模型
def RNN():
    model = Sequential()
    
    model.add(Embedding(max_words,128,input_length=max_len))
    model.add(LSTM(64))
    
    model.add(Dropout(0.5))
    model.add(BatchNormalization())
    
    model.add(Dense(256,activation="relu"))
    model.add(Dropout(0.5))
    model.add(BatchNormalization())
    
    model.add(Dense(64,activation="relu"))

    model.add(Dropout(0.5))
    
    model.add(Dense(1,activation="sigmoid"))
    
    model.summary()
    
    return model

# 画曲线
def plot_performance(history=None,figure_directory=None,ylim_pad=[0,0]):
    xlabel="Epoch"
    legends=["Training","Validation"]
    
    plt.figure(figsize=(20,5))
    
    y1=history.history["accuracy"]
    y2=history.history["val_accuracy"]
    
    min_y=min(min(y1),min(y2))-ylim_pad[0]
    max_y=max(max(y1),max(y2))+ylim_pad[0]
    
    plt.subplot(121)
    
    plt.plot(y1)
    plt.plot(y2)
    
    plt.title("Model Accuracy\n",fontsize=17)
    plt.xlabel(xlabel,fontsize=15)
    plt.ylabel("Accuracy",fontsize=15)
    plt.ylim(min_y,max_y)
    plt.legend(legends,loc="upper left")
    plt.grid()
    
    y1=history.history["loss"]
    y2=history.history["val_loss"]
    
    min_y=min(min(y1),min(y2))-ylim_pad[1]
    max_y=max(max(y1),max(y2))+ylim_pad[1]
    
    plt.subplot(122)
    
    plt.plot(y1)
    plt.plot(y2)
    
    plt.title("Model Loss:\n",fontsize=17)
    plt.xlabel(xlabel,fontsize=15)
    plt.ylabel("Loss",fontsize=15)
    plt.ylim(min_y,max_y)
    plt.legend(legends,loc="upper left")
    plt.grid()
    plt.show()

RNN

rnn_model = RNN()

Model: "sequential_1"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
embedding_1 (Embedding)      (None, 1954, 128)         7551616   
_________________________________________________________________
lstm_1 (LSTM)                (None, 64)                49408     
_________________________________________________________________
dropout_1 (Dropout)          (None, 64)                0         
_________________________________________________________________
batch_normalization_1 (Batch (None, 64)                256       
_________________________________________________________________
dense_1 (Dense)              (None, 256)               16640     
_________________________________________________________________
dropout_2 (Dropout)          (None, 256)               0         
_________________________________________________________________
batch_normalization_2 (Batch (None, 256)               1024      
_________________________________________________________________
dense_2 (Dense)              (None, 64)                16448     
_________________________________________________________________
dropout_3 (Dropout)          (None, 64)                0         
_________________________________________________________________
dense_3 (Dense)              (None, 1)                 65        
=================================================================
Total params: 7,635,457
Trainable params: 7,634,817
Non-trainable params: 640
_________________________________________________________________

loss = "binary_crossentropy"
metrics=["accuracy"]

# RNN模型训练
print("Starting...\n")
learning_rate=0.001
optimizer=Adam(learning_rate)

print("\n\nCompliling Model...\n")
rnn_model.compile(optimizer=optimizer,
                                 loss=loss,
                                 metrics=metrics)

verbose = 1
epochs=100
batch_size=128
validation_split=0.1
print("Trainning Model...\n")

rnn_history=rnn_model.fit(sequences_matrix,
                                            y_train,
                                            batch_size=batch_size,
                                            epochs=epochs,
                                            verbose=1,
                                            callbacks=callbacks,
                                            validation_split=validation_split)

Starting...



Compliling Model...

WARNING:tensorflow:From D:\software\Anaconda\anaconda\envs\tensorflow\lib\site-packages\tensorflow\python\ops\nn_impl.py:180: add_dispatch_support.<locals>.wrapper (from tensorflow.python.ops.array_ops) is deprecated and will be removed in a future version.
Instructions for updating:
Use tf.where in 2.0, which has the same broadcast rule as np.where
Trainning Model...

WARNING:tensorflow:From D:\software\Anaconda\anaconda\envs\tensorflow\lib\site-packages\keras\backend\tensorflow_backend.py:422: The name tf.global_variables is deprecated. Please use tf.compat.v1.global_variables instead.

Train on 23109 samples, validate on 2568 samples
Epoch 1/100
23109/23109 [==============================] - 320s 14ms/step - loss: 0.6358 - accuracy: 0.6747 - val_loss: 0.6019 - val_accuracy: 0.8236
Epoch 2/100
23109/23109 [==============================] - 317s 14ms/step - loss: 0.2775 - accuracy: 0.8940 - val_loss: 0.4068 - val_accuracy: 0.8162
Epoch 3/100
23109/23109 [==============================] - 319s 14ms/step - loss: 0.1187 - accuracy: 0.9601 - val_loss: 0.4475 - val_accuracy: 0.8185
Epoch 4/100
23109/23109 [==============================] - 325s 14ms/step - loss: 0.0608 - accuracy: 0.9803 - val_loss: 0.9544 - val_accuracy: 0.7819

Epoch 00004: ReduceLROnPlateau reducing learning rate to 0.0005000000237487257.
Epoch 5/100
23109/23109 [==============================] - 325s 14ms/step - loss: 0.0285 - accuracy: 0.9904 - val_loss: 0.7304 - val_accuracy: 0.8209
Restoring model weights from the end of the best epoch
Epoch 00005: early stopping

# 可视化
plot_performance(history=rnn_history)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-jeZVpTeF-1635930217671)(output_31_0.png)]

验证结果

# 数据导入
data = pd.read_csv("./Dataset/test.txt",encoding="utf-8",header=None,sep="\t",names=["label","text"])
data.head()

	label	text
0	1	如果我无聊时网上乱逛偶尔看到这部电影我可能会给它打四星但是...
1	1	服装很漂亮场景很大气演员演得也不错特技效果也非常精彩魔幻味够...
2	1	冯小刚越来越会摸国人卖搞人还有很多傻跟着转个人认为完全个喜...
3	1	该剧还是正老问题就是痕迹过重宫廷剧是最受观众欢迎所以人人来拍...
4	1	戏不够误会凑戏不够人妖凑戏不够卧底凑戏不够寻宝凑戏不够野...

y_test = data["label"]
y_test = np.array(y_test)

predict_data = data["text"]

# 将带预测数据转为序列
predict_sequences = tok.texts_to_sequences(predict_data)
predict_sequences_matrix = sequence.pad_sequences(predict_sequences,maxlen=max_len)

# RNN预测
rnn_predict_num = rnn_model.predict_classes(predict_sequences_matrix )

predict = rnn_predict_num[:,0]

predict

array([1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1,
       1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1,
       1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0,
       1, 1, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 1, 1, 0, 0,
       0, 0, 1, 0, 1, 0, 1, 0, 1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0, 0,
       0, 1, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0,
       0, 0, 0, 1, 0, 0, 1, 1, 0, 0, 0, 0, 1, 1, 0, 0, 1, 0, 0, 0, 0, 0,
       1, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1,
       0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0,
       0, 0, 0, 0, 1, 0, 0, 1, 1, 0, 0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0,
       0, 0, 0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0, 0, 1, 0, 0, 1, 0, 0,
       0, 0, 0, 0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0, 1])

y_test

array([1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0], dtype=int64)

from sklearn.metrics import accuracy_score

print(accuracy_score(predict,y_test))

0.8373983739837398

小结

点赞收藏评论走起来，亲爱的瓷们！！！！
在这里插入图片描述

本文链接：https://blog.csdn.net/Mind_programmonkey/article/details/121125587

原作者删帖不实内容删帖广告或垃圾文章投诉

智能推荐

oracle 12c 集群安装后的检查_12c查看crs状态-程序员宅基地

文章浏览阅读1.6k次。安装配置gi、安装数据库软件、dbca建库见下：http://blog.csdn.net/kadwf123/article/details/784299611、检查集群节点及状态：[root@rac2 ~]# olsnodes -srac1 Activerac2 Activerac3 Activerac4 Active[root@rac2 ~]_12c查看crs状态

解决jupyter notebook无法找到虚拟环境的问题_jupyter没有pytorch环境-程序员宅基地

文章浏览阅读1.3w次，点赞45次，收藏99次。我个人用的是anaconda3的一个python集成环境，自带jupyter notebook，但在我打开jupyter notebook界面后，却找不到对应的虚拟环境，原来是jupyter notebook只是通用于下载anaconda时自带的环境，其他环境要想使用必须手动下载一些库：1.首先进入到自己创建的虚拟环境(pytorch是虚拟环境的名字)activate pytorch2.在该环境下下载这个库conda install ipykernelconda install nb__jupyter没有pytorch环境

国内安装scoop的保姆教程_scoop-cn-程序员宅基地

文章浏览阅读5.2k次，点赞19次，收藏28次。选择scoop纯属意外，也是无奈，因为电脑用户被锁了管理员权限，所有exe安装程序都无法安装，只可以用绿色软件，最后被我发现scoop，省去了到处下载XXX绿色版的烦恼，当然scoop里需要管理员权限的软件也跟我无缘了（譬如everything）。推荐添加dorado这个bucket镜像，里面很多中文软件，但是部分国外的软件下载地址在github，可能无法下载。以上两个是官方bucket的国内镜像，所有软件建议优先从这里下载。上面可以看到很多bucket以及软件数。如果官网登陆不了可以试一下以下方式。_scoop-cn

Element ui colorpicker在Vue中的使用_vue el-color-picker-程序员宅基地

文章浏览阅读4.5k次，点赞2次，收藏3次。首先要有一个color-picker组件 <el-color-picker v-model="headcolor"></el-color-picker>在data里面data() { return {headcolor: ’ #278add ’ //这里可以选择一个默认的颜色} }然后在你想要改变颜色的地方用v-bind绑定就好了，例如：这里的:sty..._vue el-color-picker

迅为iTOP-4412精英版之烧写内核移植后的镜像_exynos 4412 刷机-程序员宅基地

文章浏览阅读640次。基于芯片日益增长的问题，所以内核开发者们引入了新的方法，就是在内核中只保留函数，而数据则不包含，由用户（应用程序员）自己把数据按照规定的格式编写，并放在约定的地方，为了不占用过多的内存，还要求数据以根精简的方式编写。boot启动时，传参给内核，告诉内核设备树文件和kernel的位置，内核启动时根据地址去找到设备树文件，再利用专用的编译器去反编译dtb文件，将dtb还原成数据结构，以供驱动的函数去调用。firmware是三星的一个固件的设备信息，因为找不到固件，所以内核启动不成功。_exynos 4412 刷机

Linux系统配置jdk_linux配置jdk-程序员宅基地

文章浏览阅读2w次，点赞24次，收藏42次。Linux系统配置jdkLinux学习教程，Linux入门教程（超详细）_linux配置jdk

随便推点

matlab(4)：特殊符号的输入_matlab微米怎么输入-程序员宅基地

文章浏览阅读3.3k次，点赞5次，收藏19次。xlabel('\delta');ylabel('AUC');具体符号的对照表参照下图：_matlab微米怎么输入

C语言程序设计-文件(打开与关闭、顺序、二进制读写)-程序员宅基地

文章浏览阅读119次。顺序读写指的是按照文件中数据的顺序进行读取或写入。对于文本文件，可以使用fgets、fputs、fscanf、fprintf等函数进行顺序读写。在C语言中，对文件的操作通常涉及文件的打开、读写以及关闭。文件的打开使用fopen函数，而关闭则使用fclose函数。在C语言中，可以使用fread和fwrite函数进行二进制读写。‍ Biaoge 于2024-03-09 23:51发布阅读量：7 ️文章类型：【 C语言程序设计】在C语言中，用于打开文件的函数是____，用于关闭文件的函数是____。

Touchdesigner自学笔记之三_touchdesigner怎么让一个模型跟着鼠标移动-程序员宅基地

文章浏览阅读3.4k次，点赞2次，收藏13次。跟随鼠标移动的粒子以grid（SOP）为partical（SOP）的资源模板，调整后连接【Geo组合+point spirit（MAT)】，在连接【feedback组合】适当调整。影响粒子动态的节点【metaball(SOP)+force(SOP)】添加mouse in（CHOP)鼠标位置到metaball的坐标，实现鼠标影响。..._touchdesigner怎么让一个模型跟着鼠标移动

【附源码】基于java的校园停车场管理系统的设计与实现61m0e9计算机毕设SSM_基于java技术的停车场管理系统实现与设计-程序员宅基地

文章浏览阅读178次。项目运行环境配置：Jdk1.8 + Tomcat7.0 + Mysql + HBuilderX（Webstorm也行）+ Eclispe（IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持）。项目技术：Springboot + mybatis + Maven +mysql5.7或8.0+html+css+js等等组成，B/S模式 + Maven管理等等。环境需要1.运行环境：最好是java jdk 1.8，我们在这个平台上运行的。其他版本理论上也可以。_基于java技术的停车场管理系统实现与设计

Android系统播放器MediaPlayer源码分析_android多媒体播放源码分析时序图-程序员宅基地

文章浏览阅读3.5k次。前言对于MediaPlayer播放器的源码分析内容相对来说比较多，会从Java-&amp;gt;Jni-&amp;gt;C/C++慢慢分析，后面会慢慢更新。另外，博客只作为自己学习记录的一种方式，对于其他的不过多的评论。MediaPlayerDemopublic class MainActivity extends AppCompatActivity implements SurfaceHolder.Cal..._android多媒体播放源码分析时序图

java 数据结构与算法 ——快速排序法-程序员宅基地

文章浏览阅读2.4k次，点赞41次，收藏13次。java 数据结构与算法 ——快速排序法_快速排序法