Fedora搭建Jupyter和数据科学环境

2020-02-08  本文已影响0人  清梦载星河
  1. 安装Jupyter核心软件包:
    a. sudo dnf install python3-notebook mathjax sscg
  2. 安装数据科学中常用模块:
    a. sudo dnf install python3-seaborn python3-lxml python3-basemap python3-scikit-image python3-scikit-learn python3-sympy python3-dask+dataframe python3-nltk
  3. 设置一个用来登录Notebook的web界面的密码,从而避免冗长的令牌:
    a. mkdir -p $HOME/.jupyter
    b. jupyter notebook password
  4. 执行上述步骤后输入密码,会自动创建$HOME/.jupyter/jupyter_notebook_config.json这个文件,其中包含了密码和加密后的版本
  5. 使用SSLby为Jupyter的web服务器生成一个自签名的HTTPS证书
    a. cd $HOME/.jupyter; sscg
  6. 编辑$HOME/.jupyter/jupyter_notebook_config.json 这个文件,下面是模板
    {
    "NotebookApp": {
    "password": "sha1:abf58...87b",
    "ip": "",
    "allow_origin": "
    ",
    "allow_remote_access": true,
    "open_browser": false,
    "websocket_compression_options": {},
    "certfile": "/home/aviram/.jupyter/service.pem",
    "keyfile": "/home/aviram/.jupyter/service-key.pem",
    "notebook_dir": "/home/aviram/Notebooks"
    }
    }
  7. 创建一个用来存放Notebook的文件夹,应该和上面的notebook_dir一样
    a. mkdir $HOME/Notebooks
  8. 完成配置,在任意地方输入jupyter notebook即可启动,或者在.bashrc中创建jn快捷命令:
    a. alias jn='jupyter notebook'
  9. 运行 jn 命令后,在浏览器中地址栏输入127.0.0.1:8888
  10. 数据科学常用工具:
    a. numpy
    b. pandas
    c. matploitlib
    d. Seaborn,基于matploitlib,绘图功能经过优化
    e. StateModels,为统计学和经济计量学的数据分析提供算法支持
    f. Scikit-learn,机器学习生态环境的重核心部件
    g. XGBoost,比较先进的回归器和分类器
    h. Imbalanced Learn,用于解决数据欠采样和过采样问题
    i. NTLK,用于处理人类语言数据的工具
    j. SHAP,用于分析机器学习做出的预测
    k. Keras,深度学习和神经网络模型的库
    l. Tensorflow,神经网络模型搭建工具
上一篇下一篇

猜你喜欢

热点阅读