本帖最后由 吐槽小能手 于 2021-8-27 11:31 编辑
1 jupyter notebook安装
安装Anaconda,下载地址:https://www.anaconda.com/products/individual#Downloads
注意Anaconda安装后,已经带了juyter notebook, 所以安装完Anaconda后就可以使用jupyter notebook了。
下载安装包后,操作步骤如下:
1) 双击打开,点击Next
2)点击I Agree
3) 点击Next
4) 选择安装路径(可自定义或使用默认安装路径)后,点击Next
5) 点击Install,等待安装完成后
6) 安装完成后点Next
7) 取消勾选下图的两个选项,点击Finish
8) 打开开始菜单,找到安装的Anaconda3目录,打开后找到Jupyter Notebook,点击打开
此时的 Jupyter Notebook 默认工作目录为 C:\Users\你的电脑名,如果想修改jupyter notebook的默认工作路径,可以按如下操作:
1)打开开始菜单,找到安装的Anaconda3目录,打开后找到 Anaconda Prompt,点击打开
2) 输入: jupyter notebook --generate-config
这个命令的作用是生成Jupyter Notebook的配置文件。如果你是第一次运行,会直接生成这个文件。如果曾经运行过这个命令,就会像下图一样问你时候要覆盖原来的文件。这个时候输入n掉过。我们的主要目的只是为了找到这个文件的路径。
3)复制配置文件路径,在文件管理器中打开,然后找到c.NotebookApp.notebook_dir这个变量,并删除这一行前面的“#”,然后输入需要指定的工作路径
改完后保存。再次通过开始菜单Anaconda3目录下的Anaconda Navigator 进入Jupyter Notebook的时候会发现默认路径已经更改。
然而,如果你直接通过Anaconda3目录下的Jupyter Notebook的快捷方式进入,默认目录还是原来那个。如果需要修改,可以进行如下步骤:
1)找到安装的Anaconda3目录,打开后找到Jupyter Notebook,然后点击右键=》更多=》打开文件夹位置,找到快捷方式所在目录
2)选中快捷方式右键点击属性
3)删除目标栏的”%USERPROFILE%“部分后,点击确定
4) 再双击打开Jupyter Notebook的快捷方式,此时工作路径已经修改好了
2 安装pyspark
1) 点击New=》Python3
2)输入下面的代码后,点击Run
- import sys
- print(sys.version)
复制代码
此时可以看到python的版本是3.6.5,我们需要下载对应的pyspark版本
3)打开开始菜单,找到安装的Anaconda3目录,打开后找到 Anaconda Prompt,点击打开后,输入下面的代码后回车
- pip install pyspark==3.0.1
复制代码
4)回到步骤二的Jupyter Notebook界面进行测试,输入下面的代码,点击Run
- from datetime import datetime, date
- from pyspark.sql import SparkSession
- from pyspark.sql import Row
- spark = SparkSession.builder.getOrCreate()
- df = spark.createDataFrame([
- Row(a=1, b=2., c='string1', d=date(2000, 1, 1), e=datetime(2000, 1, 1, 12, 0)),
- Row(a=2, b=3., c='string2', d=date(2000, 2, 1), e=datetime(2000, 1, 2, 12, 0)),
- Row(a=4, b=5., c='string3', d=date(2000, 3, 1), e=datetime(2000, 1, 3, 12, 0))
- ])
- df.show()
复制代码
到此Jupyter Notebook和pyspark已经安装完成,在此记录一下安装过程。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
|
|
|
|
共 13 个关于本帖的回复 最后回复于 2021-9-5 10:59