Pandas数据分析:读写csv

来自CloudWiki
跳转至: 导航搜索

CSV文件

CSV(Comma-Separated Values,逗号分隔值,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。

CSV 是一种通用的、相对简单的文件格式,被用户、商业和科学广泛应用。

Pandas 可以很方便的处理 CSV 文件,本文以 nba.csv 为例,你可以下载 nba.csv 或打开 nba.csv 查看。

https://static.runoob.com/download/nba.csv

读取CSV文件

基本使用

输出结果为数据的前面 5 行和末尾 5 行,中间部分以 ... 代替。

import pandas as pd

df = pd.read_csv('nba.csv')

print(df)

读取全部数据

to_string() 用于返回 DataFrame 类型的数据.

使用它可以读取全部数据。


import pandas as pd

df = pd.read_csv('nba.csv')

print(df.to_string())

指明读取行数

import pandas as pd

df = pd.read_csv(r'test1.csv',nrows=2)

print(df)

输出:

 
   编号  年龄  性别      注册时间  Unnamed: 4
0   0  A1  54  2021/8/1         NaN
1   1  A2  16  2021/8/2         NaN

写入CSV文件

我们可以使用 to_csv() 方法将 DataFrame 存储为 csv 文件:

import pandas as pd
   
# 三个字段 name, site, age
nme = ["Google", "Runoob", "Taobao", "Wiki"]
st = ["www.google.com", "www.runoob.com", "www.taobao.com", "www.wikipedia.org"]
ag = [90, 40, 80, 98]
   
# 字典
dict = {'name': nme, 'site': st, 'age': ag}
     
df = pd.DataFrame(dict)
 
# 保存 dataframe
df.to_csv('site.csv')

数据处理

head()

读取前n行

 
import pandas as pd

df = pd.read_csv('nba.csv')

print(df.head())

tail()

tail( n ) 方法用于读取尾部的 n 行,如果不填参数 n ,默认返回 5 行,空行各个字段的值返回 NaN

import pandas as pd

df = pd.read_csv('nba.csv')

print(df.tail())

info()

info() 方法返回表格的一些基本信息:

实例

import pandas as pd

df = pd.read_csv('nba.csv')

print(df.info())