数据分析之Jupyter Notebook的使用
Jupyter Notebook
Jupyter Notebook是一个交互式的Web应用程序,便于创建和共享文学化程序文档,支持实时代码,数学方程,可视化和markdown。用途包括:数据清理和转换,数值模拟,统计建模,机器学习等,是数据分析常用的应用程序,运行方法只需在使用的文件夹下输入命令“jupyter notebook”即可,接下来以在D:\1000phone为示例讲解,Jupyter Notebook的运行如下图所示。
Jupyter Notebook的使用.jpg
运行成功之后自动跳转到默认浏览器中,显示结果如下图所示。
浏览器显示结果.jpg在上图中,整个文件夹在Jupyter Notebook运行之后,可清楚地在浏览器中看到此文件夹下所有文件并可进行操作。
第一个Notebook
1.创建并命名
使用命令进入Jupyter Notebook时默认进入的是输入命令的文件夹内,本节进入的是D:\1000phone,可以直接在默认的文件夹下进行创建,本节在文件夹DataFolder下创建第一个Notebook,创建方式如下图所示。
创建Python文件.jpg点击上图中【New】并选择Python3,进入如下图所示界面,表示创建文件成功。
创建成功.jpg创建成功后可以对新文件进行命名,点击上图中的Untitled,进入如下图所示界面,并输入名称为First Notebook。若未指定命名,则默认命名为Untitled。
为创建的Notebook命名.jpg在上图输入名称First Notebook之后,点击Rename按钮则命名成功。
2.界面介绍
Jupyter Notebook界面主要由3部分组成,分别是菜单栏(Menu bar)、工具栏(Tool bar)、编码区(Code cell),如下图所示。
Jupyter Notebook界面.png菜单栏是有关Jupyter Notebook的功能选项,工具栏是编写代码或文档时可能会使用到的快捷工具按钮,编码区主要是编写者编写代码或文档的区域。
其中编码区包括四种类型,具体如下所示:
Code cell
代码区块,是编写者编码区域,可在此区域编写代码,并输出运行结果。
Markdown cell
文本区块,支持Markdown写作,代码高亮,支持任意的HTML代码插入,支持LaTeX语法;可在此区域输入上述各类标记语言,并输出渲染后的富文本。
Raw NBConvert cell
此为原始区块,Jupyter Notebook不会对此区域内的输入做任何处理,输入内容即为输出内容。
Heading cell
对文档使用标题注释结构,目前Jupyter Notebook已不再使用,可直接在Markdown cell中使用“#”字符进行处理。
注意:上述四种类型可在工具栏中自由选择。
3.编写代码并执行
创建文件成功之后可以直接在文件内编写代码并运行,例如,在上述文件输入代码print("Hello Jupyter Notebook"),并运行,运行结果如下图所示。
编写代码并运行.jpg注意:其中运行按钮是图中的Run按钮,编写代码完成后直接点击即可运行。
Jupyter Notebook编辑模式
Jupyter Notebook包含两种编辑模式,一种是编辑模式(Edit mode),另一种是命令模式(Command mode),接下来详细讲解这两种编辑模式。
1.编辑模式(Edit mode)
当Code cell左边框为绿色时,证明处在编辑模式下,在编辑模式下可正常输入各类文本代码。在编辑模式下还有很多方便的快捷键,具体如下表所示。
快捷键 | 作用 |
---|---|
Tab | 代码补全或缩进 |
Shift+Tab | 提示 |
Ctrl+] | 缩进 |
Ctrl+[ | 接触缩进 |
Ctrl+Shift+Z/ Ctrl+Y | 再做 |
Ctrl+Up/Home | 跳到单元开头 |
Ctrl+ End/Down | 跳到单元末尾 |
Ctrl+Left/Right | 跳到左/右边一个字首 |
Ctrl+Backspace/Delete | 删除前/后面一个字 |
ESC/Ctrl+M | 进入命令模式 |
Shift+Enter | 运行本单元,选中下一单元 |
Ctrl+Enter | 运行本单元 |
Alt+Enter | 运行本单元,在下面插入一单元 |
Ctrl+Shift+-/Subtract | 分割单元 |
Shift | 忽略 |
Up/ Down | 光标上/下移或转入上/下一单元 |
2.命令模式(Command mode)
当Code cell左边框为蓝色时,证明处在命令模式下,在命令模式下可在整体上对不同的区块进行编辑(调整位置、增加与删除等)。在命令模式下还有很多方便的快捷键,具体如下表所示。
快捷键 | 作用 |
---|---|
Enter | 转入编辑模式 |
Shift+Enter | 运行本单元,选中下个单元 |
Ctrl+Enter | 运行本单元 |
Alt+Enter | 运行本单元,在其下插入新单元 |
Y | 单元转入代码状态 |
M | 单元转入Markdown状态 |
R | 单元转入raw状态 |
1/2/3/4/5/6 | 设定1/2/3/4/5/6级标题 |
Up/K | 选定上方单元 |
Down/J | 选定下方单元 |
Shift+K/J | 扩大选中上/下方单元 |
A/B | 在上/下方插入新单元 |
X/C | 剪切/复制选中单元 |
Shift+V | 粘贴到上方单元 |
V | 粘贴到下方单元 |
Z | 恢复删除的最后一个单元 |
D,D | 删除选中的单元 |
Shift+M | 合并选中的单元 |
S/Ctrl+S | 文件存盘 |
L/O | 转换行号/输出 |
Shift+O | 转换输出滚动 |
Esc/Q | 关闭页面 |
H | 显示快捷键帮助 |
I,I/0,0 | 中断/重启Notebook内核 |
Shift | 忽略 |
Shift+Space | 向上滚动 |
Space | 向下滚动 |
灵活使用上述两种模式下的快捷键可使编码事半功倍。