在pycharm中使用PySpark第三方包时出现环境变量错误

2024-05-13 1237阅读

项目场景:

使用python的第三方库pyspark,运行时出现环境变量错误


问题描述

问题如下:

Missing Python executable 'python3', defaulting to 'E:\python\Lib\site-packages\pyspark\bin\..' for SPARK_HOME environment variable. Please install Python or specify the correct Python executable in PYSPARK_DRIVER_PYTHON or PYSPARK_PYTHON environment variable to detect SPARK_HOME safely.

大概意思就是缺少SPARK_HOME的环境变量和PYSPARK_PYTHON的变量,需要在环境变量中配置

注意:使用pyspark算子的时候,可能会提示“找不到python解释器”的错误,那么配置PYSPARK_PYTHON同样可以解决这个问题


解决方案:

SPARK_HOME=E:\python\Lib\site-packages\pyspark

PYSPARK_PYTHON=E:\python\python.exe

%SPARK_HOME%\bin…

  1. 第一步:

在环境变量里面新建一个SPARK_HOME变量,值就是你pyspark安装的地方,我安装到下面的路径了,找自己pyspark安装的路径

E:\python\Lib\site-packages\pyspark

在pycharm中使用PySpark第三方包时出现环境变量错误

  1. 第二步:

然后在添加一个变量PYSPARK_PYTHON,变量值填上自己的python解释器的路径,我的路径是

E:\python\python.exe

在pycharm中使用PySpark第三方包时出现环境变量错误

  1. 第三步:

在path路径中添加SPARK_HOME的bin路径

在pycharm中使用PySpark第三方包时出现环境变量错误

重启pycharm,再次运行项目,发现成功运行成功


拓展:

刚才提到,使用pyspark算子的时候,可能会报错,提示找不到python解释器,这个一般不是我们代码逻辑的问题,而需要我们做一些配置

  1. 第一种方法:

    按照上面的步骤配置PYSPARK_PYTHON到环境变量,可以解决这个问题

  2. 在pycharm中手动配置python解释器

import os
os.environ['PYSPARK_PYTHON'] = "E:/python/python.exe"

environ本质就是一个字典,添加一个键值对,就是配置python的解释器

VPS购买请点击我

文章版权声明:除非注明,否则均为主机测评原创文章,转载或复制请以超链接形式并注明出处。

目录[+]