Python数据分析：熟悉数据

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 21 entries, 0 to 20
Data columns (total 5 columns):
 #   Column      Non-Null Count  Dtype  
---  ------      --------------  -----  
 0   编号          4 non-null      float64
 1   年龄          4 non-null      object 
 2   性别          4 non-null      float64
 3   注册时间        4 non-null      object 
 4   Unnamed: 4  0 non-null      float64
dtypes: float64(3), object(2)
memory usage: 968.0+ bytes
None

获取数值分布

import pandas as pd

df = pd.read_csv(r'test1.csv')

print(df.describe())

输出：

             编号         性别  Unnamed: 4
count  4.000000   4.000000         0.0
mean   1.500000  39.500000         NaN
std    1.290994  16.542874         NaN
min    0.000000  16.000000         NaN
25%    0.750000  34.750000         NaN
50%    1.500000  44.000000         NaN
75%    2.250000  48.750000         NaN
max    3.000000  54.000000         NaN

Python数据分析：熟悉数据

目录

预览前几行

获取数据表大小

获取数据类型

获取数值分布

导航菜单

个人工具

命名空间

变种

视图

更多

搜索

导航

工具