AI Blue

来自CloudWiki
112.38.217.45讨论2018年5月23日 (三) 12:11的版本 2.5 Matplotlib简介
跳转至: 导航搜索

scikit-learn

第一章 什么是机械学习

第二章 python机械学习

2.1 开发环境搭建

安装开发环境Anaconda下载地址: [1]


2.2 IPython简介

IPython是公认的现代科学计算中最重要的Python 工具之一。它是一个加强版的Python交互式命令行工具,与系统自带的Python交互环境相比,IPython 具有以下明显的几个特点:

1、与Shell紧密关联,可以在 IPython 环境下直接执行Shell指令;

2、可以直接绘图操作的 Web GUI环境,在机器学习领域、探索数据模式、可视化数据、绘制学习曲线时,这一功能特别有用;

3、更强大的交互功能,包括内省、Tab键自动完成、魔术命令等。

2.2.1 IPython 基础

与Python相比,IPython的输出排版更加简介。

可以试着一下代码:

In[1]: a=5
In[2]:a+3
In[3]:import numpy as np
In[4]:data ={i: np.random.randn() for i in range(8)}
In[5]:data

Tab键是IPython提高效率的秘籍,如下:

np.random./按下Tab
  • 快捷键:
 
  Ctrl+A: 移动光标到本行的开头;
  Ctrl+E:  移动光标到本行的结尾;  的代不Ctrl+U:删除光标所在位置之前的所有字符;
  Ctrl+K: 删除光标所在位置之后的所有字符,包含当前光标所在的字符;
  Ctrl+L: 清除当前屏幕上显示的内容;
  Ctrl+P:以当前输入的字符作为命令的起始字符,在历史记录里向后搜索匹配的命令;.Ctrl+N:以当前输入的字符作为命令的起始字符,在历史记录里向前搜索匹配的命令;
  Ctrl+C:中断当前脚本的执行。


在IPython中可以直接在类或变量后加上一个问号“?”来查阅文档。

In[6]:np.random.randn?

在类或变量或函数后面加两个问号“??”还可以直接查看源代码。结合星号“*”和问号“?”,还可以查询命名空间里的所有函数和对象。

  • 建立一个文件:hello.py
In[7]:msg='hello ipython'
In[8]:print(msg)
 
  • 访问这个文件:

In[9]:% run hello.py

  • 快速评估代码的执行效率用%timeit,例;
In[10]:a np.random.randn(100,100)
In[11]:%timeit np.dot(a,a)

  • 常用的魔术命令:
%who或%whos:命令来查看当前环境下的变量列表;
%quickref:   显示IPython的快速参考文档;
%magic:      显示所有的魔术命令及其详细文档;
%reset:      删除当前环境下的所有变量和导入的模块;
%logstart:   开始记录IPython 里的所有输入的命令,默认保存在当前工作目录ipython_log.py中;
%logstop:    停止记录,并关闭log文件。

*在魔术命令后面加上问号“?”可以直接显示魔术命令的文档。

2.2.1 IPython 图形界面

特点

  • 方便编写多行代码
  • 可以直接把数据可视化

(看不懂)

2.3 Numpy简介

Numpy是Python科学计算的基础库,主要提供了高性能的N维数组实现以及计算能力,还提供了和其他语言如 C/C++ 集成的能力,此外还实现了一些基础的数学算法, 如约性代数相关、傅里叶变换及随机数生成等。

  • 创建数组
In[1]:import numpy as np
In[2]:a= np.array([1,2,3,4])
In[3]:a
In[4]:b=np.array([1,2],[3,4],[5,6])
In[5]:b

  • 查看array属性、数据的维度和类型。
In [6]: b.ndim
In (7]:b.shape
In [8]:b.dtype     #查看数组里元素的数据类型


  • 用Numpy函数来创建数组。
In[9]:c=np.arange(10)     #创建连续数组
In[9]:c 
In[10]: d= np.linspace(0,2,11)     #[O,2]分成11等分后的数组
In[11]:d
In[12]: np.ones((3, 3))   #注意参数两边的括号,参数是个元组





2.4 Pandas简介

2.5 Matplotlib简介

Matplotlib是python数据可视化工具包。如果要在ipython控制台使用Matplotlib。可以使用ipython--matplotlib命令来启动ipython控制程序; 如果要在ipython notebook里使用Matplotlib,则在notebook的开始位置插入%matplotlib inline魔术命令即可。 ipython的Matplotlib模式又两个优点:

  • 一是提供的非阻塞的画图操作
  • 二是不需要显示调用show()方法来显示画出来的图片。
  • 2.5.1 图形样式
   通常使用ipython notebook 的 Matplotlib模式来画图,这样画出来的图片会直接显示在网页上。要记得在notebook的最上面写上魔术命令%matplotlib inline。
   使用Matplotlib的默认样式在一个坐标轴上画出正弦和余弦曲线:
         matplotlib inline
         from matplotlib import pyplot as plt
         import numpy as np
         x = np.linspace (-np.pi,np.pi,200)
         C,S = np.cos(x), np.sin(x)
         plt.plot (x,C)
         plt.plot(x,S)
         plt.show()

2.6 scikit-laearn简介