python正在处理中_python在数据处理中常用的模块之numpy-程序员宅基地

技术标签: python正在处理中  

一 numpy模块

NumPy系统是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩阵,比Python自身的嵌套列表(nested list structure)结构要高效的多(该结构也可以用来表示矩阵(matrix))。

import numpy as np

(1).np.linalg.norm(x)

顾名思义:linalg = linear + algebra,norm则表示范数,首先需要注意的是范数是对向量(或者矩阵)的度量,是一个标量(scalar):

首先help(np.linalg.norm查看文档

norm(x, ord=None, axis=None, keepdims=False)

x表示要度量的向量,ord表示范数的种类

参数

说明

计算方法

默认

二范数

np.sqrt(x1**2+x2**2+....+xn**2)

ord=2

二范数

同上

ord=1

一范数

|x1|+|x2|+...+|xn|

ord=np.inf

无穷范数

max(|xi|)

用于计算向量x的2范数

x = np.array([3,4])

y = np.linalg.norm(x)

print(y)

输出结果为5.0

计算矩阵x的2范数 对矩阵每一个元素求平方和然后开根号

x = np.array([3,4,5],[3,4,5])

y=np.linalg.norm(x)print(x)

输出结果为10.0

(2).np.log10(x) #计算以10为底的对数

np.log(x) #log下什么都不写默认是自然对数 e为底

x1 = 10

y1 = np.log10(x1)

x2 = np.e

y2 = np.log(x2)

print(y1,y2)

输出结果为1.0 1.0

(3).np.nan_to_num:Replace nan with zero and inf with finite numbers.

把np.nan(非常小的数字,接近0)用0取代

np.inf,或者-np.inf(正负无穷大的数字)用有限数替代

np.set_printoptions(precision=8)

x= np.array([np.inf, -np.inf, np.nan, -128, 128])print(np.nan_to_num(x))

输出结果为[ 1.79769313e+308 -1.79769313e+308 0.00000000e+000 -1.28000000e+002

1.28000000e+002]

(4).numpy.random.randn(d0, d1, …, dn)是从标准正态分布中返回一个或多个样本值。

numpy.random.rand(d0, d1, …, dn)的随机样本位于[0, 1)中。

x1 = np.random.randn(2,4)print(x1)

x2= np.random.rand(2,4)print(x2)

输出结果

[[-1.47942602 0.10728309 -1.49062996 1.32908036]

[ 0.37065869 -0.04594328 0.72822393 0.74898655]]

[[ 0.54672608 0.0216933 0.04434537 0.65831692]

[ 0.06332446 0.75230353 0.12993006 0.75911764]]

(5). numpy.random.normal(loc=0.0, scale=1.0, size=None) 正太分布

参数的意义为:

loc:float 概率分布的均值,对应着整个分布的中心center

scale:float 概率分布的标准差,对应于分布的宽度,scale越大越矮胖,scale越小,越瘦高

size:int or tuple of ints 维数

(6).numpy.random.random(size)

random.random()用于生成一个0到1的随机符点数: 0 <= n

< 1.0

(7).numpy.random.uniform(a,b) 用于生成一个指定范围内的随机符点数,两个参数其中一个是上限,一个是下限。如果a > b,则生成的随机数n: a <= n <= b。如果

a

print random.uniform(10, 20)print random.uniform(20, 10)#18.7356606526#12.5798298022

(8).random.randint(a, b)

用于生成一个指定范围内的整数。其中参数a是下限,参数b是上限,生成的随机数n: a <= n <= b

print random.randint(12, 20) #生成的随机数 n: 12 <= n <= 20

print random.randint(20, 20) #结果永远是20#print random.randint(20, 10) # 该语句是错误的。下限必须小于上限

(9).random.randrange([start], stop[, step])

从指定范围内,按指定基数递增的集合中 获取一个随机数。如:random.randrange(10, 100, 2),结果相当于从[10, 12, 14, 16, ... 96, 98]序列中获取一个随机数。random.randrange(10, 100, 2)在结果上与 random.choice(range(10, 100, 2) 等效.

(10).andom.choice(sequence)

从序列中获取一个随机元素。其函数原型为:random.choice(sequence)。参数sequence表示一个有序类型。这里要说明 一下:sequence在python不是一种特定的类型,而是泛指一系列的类型。list, tuple, 字符串都属于sequence。有关sequence可以查看python手册数据模型这一章。下面是使用choice的一些例子:

print random.choice("学习Python")print random.choice(["JGood", "is", "a", "handsome", "boy"])print random.choice(("Tuple", "List", "Dict"))

(11).random.shuffle(x[, random])

用于将一个列表中的元素打乱。如:

p = ["Python", "is", "powerful", "simple", "and so on..."]

random.shuffle(p)printp#['powerful', 'simple', 'is', 'Python', 'and so on...']

(12)对ndarray类型使用len函数

len用于获取一个数组的长度,如果是多维数组,则获取数组的行数。

temp = np.zeros(shape=[10,20])print(len(temp)) #10

(13)np.squeeze(a, axis=None):

从数组的形状中删除单维度条目,即把shape中为1的维度去掉。

x = np.array([[[0], [1], [2]]])print(x.shape) #(1, 3, 1)

print(np.squeeze(x).shape) #(3,)

print(np.squeeze(x, axis=(2,)).shape) #(1, 3)

(14). np.expand_dims(a, axis):

该函数和np.squeeze()正好相反,数组形状扩充一个维度的。

x = np.array([1,2])print(x.shape) #(2,)

y = np.expand_dims(x, axis=0)print(y.shape) #(1, 2)

(15)列向量和行向量,以及秩为1的数组的区别

#-*- coding: utf-8 -*-

"""Created on Sun Mar 25 20:17:21 2018

x = np.array([[[0], [1], [2]]])print(x.shape) #(1, 3, 1)

print(np.squeeze(x).shape) #(3,)

print(np.squeeze(x, axis=(2,)).shape) #(1, 3)

@author: Administrator"""

importnumpy as np'''下面显示了秩为1的数组以及列向量和行向量的使用,以及区别.我们在使用的时候最好不要使用秩为1的数组

并且当我们不确定矩阵或者向量的维数维数时,我们可以使用.reshape(m,n)指定'''

#a为秩为1的数组,我们可以看到转置和本身一致,shape都是(5,)

a = np.random.randn(5)print(a,a.shape) #[ 0.58371745 0.62467384 0.72225761 -0.32777546 -1.06321595] (5,)

print(a.T,a.T.shape) #[ 0.58371745 0.62467384 0.72225761 -0.32777546 -1.06321595] (5,)

r=np.dot(a,a)print(r,r.shape) #2.49046445333 ()

r=np.dot(a,a.T)print(r,r.shape) #2.49046445333 ()

#a1为5x1的列向量

a1 = np.random.randn(5,1)print(a1,a1.shape) #[[-0.20126605]

#[-0.08183096]

#[ 0.12709234]

#[ 1.88915869]

#[1.18566033]] (5, 1)

#r1 = np.dot(a1,a1) #会报错 shapes (5,1) and (5,1) not aligned: 1 (dim 1) != 5 (dim 0)#print(r1,r1.shape)

r1=np.dot(a1,a1.T)print(r1,r1.shape) #[[ 0.04050802 0.01646979 -0.02557937 -0.3802235 -0.23863317]

#[ 0.01646979 0.00669631 -0.01040009 -0.15459166 -0.09702372]

#[-0.02557937 -0.01040009 0.01615246 0.24009759 0.15068834]

#[-0.3802235 -0.15459166 0.24009759 3.56892057 2.23990052]

#[-0.23863317 -0.09702372 0.15068834 2.23990052 1.40579042]] (5, 5)

#a2为1x5的行向量

a2 = np.random.randn(1,5)print(a2,a2.shape) #[ 0.48272148 0.4743339 -0.31309436 2.01153588 -0.58482391] (5,)

#r2 = np.dot(a2,a2) #会报错 shapes (1,5) and (,5) not aligned: 5 (dim 5) != 1 (dim 0)#print(r2,r2.shape)

r2=np.dot(a2,a2.T)print(r2,r2.shape) #[[ 3.81502768]] (1, 1)

#由list或者touple转换为的秩为数组,我们最好指定其shape

c = np.array([1,2,3,4])

print(c.shape) #(4,)

c = np.array([1,2,3,4]).reshape(4,1)

print(c.shape) #(4,1)

d = np.array([[1,2,3],[4,5,6]])

print(d.shape) #(2,3)

参考文献

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_39958137/article/details/110068414

智能推荐

量化投资之工具篇一:Backtrader从入门到精通(7)-Indicator类源代码解读(2)_dst[i] = math.fsum(src[i - period + 1:i + 1]) / pe-程序员宅基地

文章浏览阅读6.4k次,点赞20次,收藏54次。接上一篇继续。系统内置Indicator的介绍Backtrader提供了很多内置的Indicator,了解这些Indicator对我们自定义指标、理解现有指标以及制定策略具有重要作用。基本操作类Backtrader提供了很多基本操作类,作为定义其他指标的基准。先看PeriodN,这个类是所有需要使用周期进行计算指标(例如移动平均)的基类:class PeriodN(Indicator): ''' Base class for indicators which take a per_dst[i] = math.fsum(src[i - period + 1:i + 1]) / period indexerror: array ass

N76E003使用syn6288_n76e003 开发环境-程序员宅基地

文章浏览阅读312次。代码如下:/*---------------------------------------------------------------------------------------------------------*//* *//* Copyright(c) 2015 Nuvoton T_n76e003 开发环境

转载:Ubuntu16.04安装视觉SLAM环境(g2o)-程序员宅基地

文章浏览阅读102次。原文链接https://www.cnblogs.com/ambition921009/p/10551959.html1、首先在github上下载g2o图优化库git clone https://github.com/RainerKuemmerle/g2o.git2、运行安装以下依赖库sudo apt-get install libcholmod3.0.6sudo apt-get ...

2021最全大数据学习路线(建议收藏)_大数据先学数学还是先学编程-程序员宅基地

文章浏览阅读9.2w次,点赞895次,收藏6.5k次。大数据是未来的趋势,在数字化转型时代,把握大数据是关键的!_大数据先学数学还是先学编程

Mybatis中使用list集合或者数组array作为查询参数,进行查询是foreach标签中的collection怎么写?_mybatisplus根据list集合查询参数-程序员宅基地

文章浏览阅读1.3k次。一直用的的mybatis进行查询数据,对于有些内容容易忘记,这里整理一下,如果有纰漏请指正!先上简单的代码<select id="getUsernameList" parameterType="java.util.List" resultType="java.lang.String"> select username from sys_user su where su.user_id in <f._mybatisplus根据list集合查询参数

few-shot learning 小样本学习---综述_[7] wang y, yao q. few-shot learning: a survey[j].-程序员宅基地

文章浏览阅读8k次,点赞3次,收藏49次。小样本学习(Few-shot Learning)综述 (出自阿里巴巴团队2019年4月)Few-shot Learning: A Survey YAQING WANG1,2 , QUANMING YAO 2019_[7] wang y, yao q. few-shot learning: a survey[j]. 2019.

随便推点

scrapy实践二(selenium爬取腾讯漫画【失败】)-程序员宅基地

文章浏览阅读544次。前言一个月前曾学习过爬取腾讯动漫全站的示例代码,现在再用scrapy尝试过程新建spider爬虫编写普通selenium爬虫爬取漫画观察网页本次目标是爬取热门排行下的漫画右键检查可以发现漫画标题和链接可以轻松获取(前提是用selenium)一步from selenium import webdriverfrom selenium.webdriver.support.ui import WebDriverWaitfrom selenium.webdriver.common.by i

根据面要素图层迭代出面要素批量裁切(掩膜提取)影像_迭代要素 批量掩膜-程序员宅基地

文章浏览阅读2.8k次。看了虾神的文章,大数据之:影像提取中深度学习样本库获取的思考,http://blog.csdn.net/hailiannanhai/article/details/78130042。忍不住自己要试试。下面就写一下试试的过程,用一个矢量要素图层(包含多个面要素),一副影像为基础,用迭代做裁切,循环裁切出一幅一幅的影像。模型图如下所示。左边要素为面矢量要素层,里面含有多个面要素_迭代要素 批量掩膜

(五)QString和数字的转换_数字转qstring-程序员宅基地

文章浏览阅读1.4w次,点赞7次,收藏35次。1.QString转数字QString类提供了非常方便的数字类型转换,包括常用的int float double等,也包括不常用的long long等,具体转换如下: QString string = "1"; int int_string = string.toInt();//int类型 long long_string = string.toLong();//long float float_string = string.toFloat();//float s_数字转qstring

数据挖掘工程师的基本职责。_数据挖掘工程师的能力-程序员宅基地

文章浏览阅读1.7k次。转载自品略图书馆http://www.pinlue.com/article/2020/03/1707/2210031765835.html数据挖掘工程师负责科技数据挖掘算法模型的构建、应用、评测、报告。下面是第一范文网小编为您精心整理的数据挖掘工程师的基本职责。  数据挖掘工程师的基本职责1  职责:  1、参与K12教育行业大数据分析、大数据处理、数据挖掘等系统的设计和开..._数据挖掘工程师的能力

【C++ STL应用与实现】23: 如何使用std::mem_fn (since C++11)_aux_source_directory called with incorrect-程序员宅基地

文章浏览阅读2w次,点赞9次,收藏20次。本文总结了STL中函数适配器:`mem_fn`系列函数的用法,它们是:`mem_fun (c++98)`, `mem_fun_ref (c++98)`, `mem_fn (c++11)`. 文中给出了它们各自的使用范围及代码示例,提到了mem_fn的使用限制,使用bind来解决这个限制。_aux_source_directory called with incorrect

hive创建表和增加表分区的两种方式_hive表增加分区-程序员宅基地

文章浏览阅读3.5w次,点赞3次,收藏40次。hive表增加分区的两种方式第一种方式:load data local inpath注意点:1.必须是本地文件,不能是集群上的文件2.文件路径中的变量如果无法替换,可以把单引号换成双引号,一般双引号总是没问题的3.hive库在配置的时候有一个hdfs基础路径,用这种方式创建的表时可以不指定hdfs路径,导入数据后会自然在“hdfs基础路径/表名/”下生成相应的分区文件夹4.用desc ..._hive表增加分区

推荐文章

热门文章

相关标签