【python】详解pandas.DataFrame.loc函数_dataframe loc函数_brucewong0516的博客-程序员宅基地

技术标签: pandas  loc  python  iloc  dataframe  索引  

官方函数

DataFrame.loc
Access a group of rows and columns by label(s) or a boolean array.
.loc[] is primarily label based, but may also be used with a boolean array.
# 可以使用label值,但是也可以使用布尔值
Allowed inputs are: # 可以接受单个的label,多个label的列表,多个label的切片

•A single label, e.g. 5 or ‘a’, (note that 5 is interpreted as a label of the index, and never as an integer position along the index). #这里的5不是数值指定的位置,而是label值
•A list or array of labels, e.g. [‘a’, ‘b’, ‘c’].
•A slice object with labels, e.g. ‘a’:’f’.

Warning: #如果使用多个label的切片,那么切片的起始位置都是包含的

Note that contrary to usual python slices, both the start and the stop are included
•A boolean array of the same length as the axis being sliced, e.g. [True, False, True].

实例详解

一、选择数值

1、生成df
df = pd.DataFrame([[1, 2], [4, 5], [7, 8]],
...      index=['cobra', 'viper', 'sidewinder'],
...      columns=['max_speed', 'shield'])

df
Out[15]: 
            max_speed  shield
cobra               1       2
viper               4       5
sidewinder          7       8
2、Single label. 单个 row_label 返回的Series
 df.loc['viper']
Out[17]: 
max_speed    4
shield       5
Name: viper, dtype: int64
2、List of labels. 列表 row_label 返回的DataFrame
df.loc[['cobra','viper']]
Out[20]: 
       max_speed  shield
cobra          1       2
viper          4       5
3、Single label for row and column 同时选定行和列
df.loc['cobra', 'shield']
Out[24]: 2
4、Slice with labels for row and single label for column. As mentioned above, note that both the start and stop of the slice are included. 同时选定多个行和单个列,注意的是通过列表选定多个row label 时,首位均是选定的。
df.loc['cobra':'viper', 'max_speed']
Out[25]: 
cobra    1
viper    4
Name: max_speed, dtype: int64
5、Boolean list with the same length as the row axis 布尔列表选择row label

布尔值列表是根据某个位置的True or False 来选定,如果某个位置的布尔值是True,则选定该row

df
Out[30]: 
            max_speed  shield
cobra               1       2
viper               4       5
sidewinder          7       8

df.loc[[True]]
Out[31]: 
       max_speed  shield
cobra          1       2

df.loc[[True,False]]
Out[32]: 
       max_speed  shield
cobra          1       2

df.loc[[True,False,True]]
Out[33]: 
            max_speed  shield
cobra               1       2
sidewinder          7       8
6、Conditional that returns a boolean Series 条件布尔值
df.loc[df['shield'] > 6]
Out[34]: 
            max_speed  shield
sidewinder          7       8
7、Conditional that returns a boolean Series with column labels specified 条件布尔值和具体某列的数据
df.loc[df['shield'] > 6, ['max_speed']]
Out[35]: 
            max_speed
sidewinder          7
8、Callable that returns a boolean Series 通过函数得到布尔结果选定数据
df
Out[37]: 
            max_speed  shield
cobra               1       2
viper               4       5
sidewinder          7       8

df.loc[lambda df: df['shield'] == 8]
Out[38]: 
            max_speed  shield
sidewinder          7       8

二、赋值

1、Set value for all items matching the list of labels 根据某列表选定的row 及某列 column 赋值
df.loc[['viper', 'sidewinder'], ['shield']] = 50

df
Out[43]: 
            max_speed  shield
cobra               1       2
viper               4      50
sidewinder          7      50
2、Set value for an entire row 将某行row的数据全部赋值
df.loc['cobra'] =10

df
Out[48]: 
            max_speed  shield
cobra              10      10
viper               4      50
sidewinder          7      50
3、Set value for an entire column 将某列的数据完全赋值
df.loc[:, 'max_speed'] = 30

df
Out[50]: 
            max_speed  shield
cobra              30      10
viper              30      50
sidewinder         30      50
4、Set value for rows matching callable condition 条件选定rows赋值
df.loc[df['shield'] > 35] = 0

df
Out[52]: 
            max_speed  shield
cobra              30      10
viper               0       0
sidewinder          0       0

三、行索引是数值

df = pd.DataFrame([[1, 2], [4, 5], [7, 8]],
...      index=[7, 8, 9], columns=['max_speed', 'shield'])

df
Out[54]: 
   max_speed  shield
7          1       2
8          4       5
9          7       8

通过 行 rows的切片的方式取多个:

df.loc[7:9]
Out[55]: 
   max_speed  shield
7          1       2
8          4       5
9          7       8

四、多维索引

1、生成多维索引
tuples = [
...    ('cobra', 'mark i'), ('cobra', 'mark ii'),
...    ('sidewinder', 'mark i'), ('sidewinder', 'mark ii'),
...    ('viper', 'mark ii'), ('viper', 'mark iii')
... ]
index = pd.MultiIndex.from_tuples(tuples)
values = [[12, 2], [0, 4], [10, 20],
...         [1, 4], [7, 1], [16, 36]]
df = pd.DataFrame(values, columns=['max_speed', 'shield'], index=index)


df
Out[57]: 
                     max_speed  shield
cobra      mark i           12       2
           mark ii           0       4
sidewinder mark i           10      20
           mark ii           1       4
viper      mark ii           7       1
           mark iii         16      36
2、Single label. 传入的就是最外层的row label,返回DataFrame
df.loc['cobra']
Out[58]: 
         max_speed  shield
mark i          12       2
mark ii          0       4
3、Single index tuple.传入的是索引元组,返回Series
df.loc[('cobra', 'mark ii')]
Out[59]: 
max_speed    0
shield       4
Name: (cobra, mark ii), dtype: int64
4、Single label for row and column.如果传入的是row和column,和传入tuple是类似的,返回Series
df.loc['cobra', 'mark i']
Out[60]: 
max_speed    12
shield        2
Name: (cobra, mark i), dtype: int64
5、Single tuple. Note using [[ ]] returns a DataFrame.传入一个数组,返回一个DataFrame
df.loc[[('cobra', 'mark ii')]]
Out[61]: 
               max_speed  shield
cobra mark ii          0       4
6、Single tuple for the index with a single label for the column 获取某个colum的某row的数据,需要左边传入多维索引的tuple,然后再传入column
df.loc[('cobra', 'mark i'), 'shield']
Out[62]: 2
7、传入多维索引和单个索引的切片:
df.loc[('cobra', 'mark i'):'viper']
Out[63]: 
                     max_speed  shield
cobra      mark i           12       2
           mark ii           0       4
sidewinder mark i           10      20
           mark ii           1       4
viper      mark ii           7       1
           mark iii         16      36

df.loc[('cobra', 'mark i'):'sidewinder']
Out[64]: 
                    max_speed  shield
cobra      mark i          12       2
           mark ii          0       4
sidewinder mark i          10      20
           mark ii          1       4

df.loc[('cobra', 'mark i'):('sidewinder','mark i')]
Out[65]: 
                    max_speed  shield
cobra      mark i          12       2
           mark ii          0       4
sidewinder mark i          10      20
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/brucewong0516/article/details/82494090

智能推荐

为什么ServerSocket接收不到客户端Socket发送的信息? -程序员宅基地

为什么ServerSocket接收不到客户端Socket发送的信息? 问题代码(由于问题来源的程序代码较多,所以这里只列出相关代码):服务器端ServerSocket处理相关代码ServerSocket serversocket=new ServerSocket(10000);while(true){ socket=serversocket.accept(); bufferedread=new

column length too big for column ‘param_value‘ (max = 21845) use blob or text instead_column length too big for column '' (max = 21845);-程序员宅基地

varchar(n):n 指可存储字符长度 mysql在不同字符集下一个字符的字节长度不同,所以选择不同字符集可存储的字符长度不同。varchar 可存储最大字节长度是:65535字节对于latin字符集下,因为一个字符占一个字节,所以M的最大值为65535(但实际只有65532);对于gbk字符集,因为一个字符占两个字节,所以M的最大值为32767;对于utf8字符集,因为一个字符占两到三个字节,所以M的最大值为21845。..._column length too big for column '' (max = 21845); use blob or text instead

NoSQL之Redis配置与优化_nosql优化-程序员宅基地

目录关系数据库与非关系型数据库存储数据类型分类非关系型数据库产生背景Redis简介Redis与Memcached区别支持的存储类型不同数据落盘内存空间与数据量使用场景会话缓存(Session Cache)全页缓存(FPC)队列排行榜/计数器发布/订阅其他Redis支持五种数据类型String (字符串)实例:Hash (哈希)实例List(列表)实例Set(集合)实例zset(sorted set:有序集合)实例总结关系数据库与非关系型数据库存储数据类型分类1.结构化数据:可以通过二维表格形式表述这个_nosql优化

html视频播放 禁止播放进度条_html video禁用 播放条-程序员宅基地

引用videojs API中文文档详解第一步引用API<link href="https://cdnjs.cloudflare.com/ajax/libs/video.js/7.3.0/video-js.min.css" rel="stylesheet"><script src="https://cdnjs.cloudflare.com/aj_html video禁用 播放条

Arduino基础入门语法学习_arduino基础语法-程序员宅基地

和STM32比起来,Arduino相对好学多了,直接使用库函数就行了,不用涉及到寄存器底层配置和开发;和STM32库函数方式比起来,它应该也会好学很多(我现在也是刚开始)。我学习Arduino的主要原因就是自己买了个机械臂,控制板子是某宝买的基于arduino mega328的舵机控制板,想让臂和ros系统进行通讯,以便进行后续的扩展学习。下面记录一下自己学习arduino的过程。Arduin..._arduino基础语法

利用numpy生成指定范围的数据_numpy生成范围值-程序员宅基地

假如有这样一个需求,生成8个字段,每个字段可指定范围,模拟这样的数据,代码很简单import numpy as npimport pandas as pdlenth=2000size=8#定义每个字段的范围dic={}dic['min1']=1#字段1的最小值dic['max1']=20#字段1的最大值dic['min2']=1dic['max2']=20dic['min3']=1dic['max3']=20dic['min4']=1dic['max4']=20dic_numpy生成范围值

随便推点

c语言 文件读取 坐标,用c语言读取24位位图bmp文件-程序员宅基地

匿名用户1级2013-12-21 回答可以使用C语言标准函数库中的fopen、fseek、fclose等系列函数来打开bmp位图文件,以及进行相应的处理,下面是一个demo,仅供参考。以下代码在vc6.0中编译通过。#include#include#defineBITMAPFILEHEADERLENGTH14//ThebmpFileHeaderlengthis14#def..._c语言读取24位bmp

32位RedHat Enterprise Linux 5 Update 4下安装Oracle10.2.0.1(转载)_redhat 4 32位-程序员宅基地

安装要求:CPU,1GMHz以上 内存,1G以上 硬盘,安装系统后建议10G空闲空间1、检查和安装必要的软件包: binutils-2.17.50.0.6 compat-libstdc++-33-3.2.3 elfutils-libelf-0.125 elfutils-libelf-devel-0.125 gcc-4.1.1 gcc-c+_redhat 4 32位

CSS文字两端对齐_css内容两边平齐-程序员宅基地

微信小程序—-CSS文字两端对齐场景—-在微信小程序的表单开发中常遇到 input 的 label 需要进行文字的两端对齐!参考:真正可用的CSS文字两端对齐 由于真正可用的CSS文字两端对齐需要放置一个空标签,本人对此处进行了优化处理,利用伪元素 after 代替空标签 span,来实现该效果,同时将两端对齐的样式提成公用样式的 class ,需要时直接使用。效果..._css内容两边平齐

mailx(mail)配置outlook SMTP方式发送邮件-程序员宅基地

原文地址:http://blog.51cto.com/wutou/19391170x01,环境介绍:我们用的是微软的邮箱打算用SMTP方式发送邮件。先登录账户看官方给出SMTP信息。 0x02,系统mailx(mail)设置。通过命令可以看到,mail实际上是mailx的快捷方式。然后在/etc/mail.rc里加入账号等信息。SMTP加密方式是:STARTTLS...

Spark | 解析SparkSQL运行原理之Sql Analysis阶段_sparksql analysis-程序员宅基地

(一) 解析SparkSQL运行原理之Sql Parse 阶段上一篇文章在介绍Sql Parse阶段时,该阶段主要是使用Antlr4将一条SQL语句解析成语法树,然后使用Antlr4的访问者模式遍历生成语法树,也就是Logical Plan。但其实,Sql Parse这一阶段生成的Logical Plan是被称为Unresolved Logical Plan。所谓Unresolved,就是说SQL语句中的对象都是未解释的。在论文中有介绍到Spark Sql以要计算的关系开头,从SQL解析器返回的抽象_sparksql analysis

用python调用tesseract ocr批量识别图片上的文字_python 批量提取图片中的文字 tesseract lang=-程序员宅基地

下面的程序可以批量对文件夹下面的图片进行识别,只需要修改相应的文件夹位置即可,有很多文章讲述如何安装tesseract,这里不在赘述如何安装,直接放代码。from PIL import Imageimport pytesseractimport string, re, osimport codecsdef imgtostr(imgpath): '''识别图片中的所有文字''' image = Image.open(imgpath,'r') text = pytesser_python 批量提取图片中的文字 tesseract lang=