您现在的位置是：首页 > Pandas

当前栏目

Pandas DataFrame的基本属性详解

Pandas,DataFrame,基本,属性,详解

2025-03-20 08:48:58 时间

大家好，又见面了，我是你们的朋友全栈君。

注：以下代码均在Jupyter中运行的。

基本功能列表

import pandas as pd 导入库

df = pd.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False) 创建一个DataFrame

代码	功能
DataFrame()	创建一个DataFrame对象
df.values	返回ndarray类型的对象
df.iloc[ 行序,列序 ]	按序值返回元素
df.loc[ 行索引,列索引 ]	按索引返回元素
df.index	获取行索引
df.columns	获取列索引
df.axes	获取行及列索引
df.T	行与列对调
df. info()	打印DataFrame对象的信息
df.head(i)	显示前 i 行数据
df.tail(i)	显示后 i 行数据
df.describe()	查看数据按列的统计信息

创建一个DataFrame

DataFrame()函数的参数index的值相当于行索引，若不手动赋值，将默认从0开始分配。columns的值相当于列索引，若不手动赋值，也将默认从0开始分配。

data = { 
   
        '性别':['男','女','女','男','男'],
        '姓名':['小明','小红','小芳','大黑','张三'],
        '年龄':[20,21,25,24,29]}
df = pd.DataFrame(data,index=['one','two','three','four','five'],
               columns=['姓名','性别','年龄','职业'])
df

运行结果：

df.values 返回ndarray类型的对象

ndarray类型即numpy的 N 维数组对象,通常将DataFrame类型的数据转换为ndarray类型的比较方便操作。如对DataFrame类型进行切片操作需要df.iloc[ : , 1:3]这种形式，对数组类型直接X[ : , 1:3]即可。

X = df.values
print(type(X)) #显示数据类型
X

运行结果：

<class 'numpy.ndarray'>
[['小明' '男' 20 nan]
 ['小红' '女' 21 nan]
 ['小芳' '女' 25 nan]
 ['大黑' '男' 24 nan]
 ['张三' '男' 29 nan]]

df.iloc[ 行序,列序 ] 按序值返回元素

df.iloc[1,1]

运行结果：

Index(['one', 'two', 'three', 'four', 'five'], dtype='object')

df.loc[ 行索引,列索引 ] 按索引返回元素

df.loc['one','性别']

运行结果：

男

df.index 获取行索引

df.index

运行结果：

Index(['one', 'two', 'three', 'four', 'five'], dtype='object')

df.columns 获取列索引

df.columns

运行结果：

Index(['姓名', '性别', '年龄', '职业'], dtype='object')

df.axes 获取行及列索引

df.axes

运行结果：

[Index(['one', 'two', 'three', 'four', 'five'], dtype='object'),
 Index(['姓名', '性别', '年龄', '职业'], dtype='object')]

df.T index 与 columns 对调

df.T

运行结果：

df.info() 打印DataFrame对象的信息

df.info()

运行结果：

<class 'pandas.core.frame.DataFrame'>
Index: 5 entries, one to five
Data columns (total 4 columns):
姓名    5 non-null object
性别    5 non-null object
年龄    5 non-null int64
职业    0 non-null object
dtypes: int64(1), object(3)
memory usage: 200.0+ bytes

df.head(i) 显示前 i 行数据

df.head(2)

运行结果：

若想要显示前几列数据，可用df.T.head(i)

df.tail(i) 显示后 i 行数据

df.tail(2)

运行结果：

df.describe() 查看数据按列的统计信息

可显示数据的数量、缺失值、最小最大数、平均值、分位数等信息

             年龄
count   5.000000
mean   23.800000
std     3.563706
min    20.000000
25%    21.000000
50%    24.000000
75%    25.000000
max    29.000000

发布者：全栈程序员栈长，转载请注明出处：https://javaforall.cn/137759.html原文链接：https://javaforall.cn

猜你喜欢

pycharm python安装教程_python环境安装教程
快速入门Python机器学习（36）
java浅拷贝和深拷贝的区别_python的浅拷贝和深拷贝
pycharm安装opencv-python_pycharm opencv
pycharm运行环境配置_pycharm安装django
vscode查看源代码_vscode新建python项目
python实现K近邻算法案例
快速入门Python机器学习（27）
python基本代码大全_python怎么运行代码
python——初识python(安装pycharm和ipython)
python 快速读取压缩包内文件
利用python pip以及pyCharm安装requests第三方库「建议收藏」
pycharm中安装django_pycharm环境配置教程
Django-缓存内容
python换行符使用_python中怎么换行？「建议收藏」
pythoncharm注释快捷键_jsp注释快捷键
Vmware安装Ubuntu16.4、Ubuntu里安装python3.9、Ubuntu安装PyCharm的过程及出现的问题的解决[通俗易懂]
Python 编程 | 连载 25 - Python 多进程
Pycharm如何创建Django项目「建议收藏」
Python项目47-前后端分离登录注册页(继续撸)

Python程序教程

当前栏目

Pandas DataFrame的基本属性详解

基本功能列表

创建一个DataFrame

df.values 返回ndarray类型的对象

df.iloc[ 行序,列序 ] 按序值返回元素

df.loc[ 行索引,列索引 ] 按索引返回元素

df.index 获取行索引

df.columns 获取列索引

df.axes 获取行及列索引

df.T index 与 columns 对调

df.info() 打印DataFrame对象的信息

df.head(i) 显示前 i 行数据

df.tail(i) 显示后 i 行数据

df.describe() 查看数据按列的统计信息

相关文章