Fedora搭建Jupyter和数据科学环境
2020-02-08 本文已影响0人
清梦载星河
- 安装Jupyter核心软件包:
a. sudo dnf install python3-notebook mathjax sscg - 安装数据科学中常用模块:
a. sudo dnf install python3-seaborn python3-lxml python3-basemap python3-scikit-image python3-scikit-learn python3-sympy python3-dask+dataframe python3-nltk - 设置一个用来登录Notebook的web界面的密码,从而避免冗长的令牌:
a. mkdir -p $HOME/.jupyter
b. jupyter notebook password - 执行上述步骤后输入密码,会自动创建$HOME/.jupyter/jupyter_notebook_config.json这个文件,其中包含了密码和加密后的版本
- 使用SSLby为Jupyter的web服务器生成一个自签名的HTTPS证书
a. cd $HOME/.jupyter; sscg - 编辑$HOME/.jupyter/jupyter_notebook_config.json 这个文件,下面是模板
{
"NotebookApp": {
"password": "sha1:abf58...87b",
"ip": "",
"allow_origin": "",
"allow_remote_access": true,
"open_browser": false,
"websocket_compression_options": {},
"certfile": "/home/aviram/.jupyter/service.pem",
"keyfile": "/home/aviram/.jupyter/service-key.pem",
"notebook_dir": "/home/aviram/Notebooks"
}
} - 创建一个用来存放Notebook的文件夹,应该和上面的notebook_dir一样
a. mkdir $HOME/Notebooks - 完成配置,在任意地方输入jupyter notebook即可启动,或者在.bashrc中创建jn快捷命令:
a. alias jn='jupyter notebook' - 运行 jn 命令后,在浏览器中地址栏输入127.0.0.1:8888
- 数据科学常用工具:
a. numpy
b. pandas
c. matploitlib
d. Seaborn,基于matploitlib,绘图功能经过优化
e. StateModels,为统计学和经济计量学的数据分析提供算法支持
f. Scikit-learn,机器学习生态环境的重核心部件
g. XGBoost,比较先进的回归器和分类器
h. Imbalanced Learn,用于解决数据欠采样和过采样问题
i. NTLK,用于处理人类语言数据的工具
j. SHAP,用于分析机器学习做出的预测
k. Keras,深度学习和神经网络模型的库
l. Tensorflow,神经网络模型搭建工具