<strike id="gcwsi"></strike>
  • <ul id="gcwsi"></ul>

    千鋒教育-做有情懷、有良心、有品質(zhì)的職業(yè)教育機(jī)構(gòu)

    400-811-9990
    手機(jī)站
    千鋒教育

    千鋒學(xué)習(xí)站 | 隨時隨地免費(fèi)學(xué)

    千鋒教育

    掃一掃進(jìn)入千鋒手機(jī)站

    領(lǐng)取全套視頻
    千鋒教育

    關(guān)注千鋒學(xué)習(xí)站小程序
    隨時隨地免費(fèi)學(xué)習(xí)課程

    上海
    • 北京
    • 鄭州
    • 武漢
    • 成都
    • 西安
    • 沈陽
    • 廣州
    • 南京
    • 深圳
    • 大連
    • 青島
    • 杭州
    • 重慶
    當(dāng)前位置:哈爾濱千鋒IT培訓(xùn)  >  技術(shù)干貨  >  python怎么用python寫spark

    python怎么用python寫spark

    來源:千鋒教育
    發(fā)布人:xqq
    時間:2023-11-07 23:23:47

    為什么要使用Python來寫Spark

    Python寫spark我認(rèn)為唯一的理由就是:你要做數(shù)據(jù)挖掘,AI相關(guān)的工作。因?yàn)楹芏嘧鰯?shù)挖的他們的基礎(chǔ)語言都是python,他們?nèi)绻匦聦W(xué)scala比較耗時,而且,python他的強(qiáng)大類庫是他的優(yōu)勢,很多算法庫只有python有。

    Win本地編寫代碼調(diào)試

    編輯器:PyCharm

    Spark:1.6

    Python:2.7

    Win環(huán)境準(zhǔn)備

    Python的安裝

    解壓python包,在環(huán)境變量里面配上bin的路徑

    Spark的安裝

    下載spark的bin文件,解壓即可,在環(huán)境變量配置SPARK_HOME

    要可以通過編輯器來安裝,如pycharm,查找pyspark庫安裝即可

    Hadoop安裝

    安裝hadoop環(huán)境。在win下面需要winutils.exe;在環(huán)境里面配置HADOOP_HOME即可。

    代碼示例

    #-*-coding:utf-8-*-

    from__future__importprint_function

    frompysparkimport*

    importos

    print(os.environ['SPARK_HOME'])

    print(os.environ['HADOOP_HOME'])

    if__name__=='__main__':

    sc=SparkContext("local[8]")

    rdd=sc.parallelize("helloPysparkworld".split(""))

    counts=rdd\

    .flatMap(lambdaline:line)\

    .map(lambdaword:(word,1))\

    .reduceByKey(lambdaa,b:a+b)\

    .foreach(print)

    sc.stop

    問題:

    frompysparkimport*

    找不到pyspark。那你需要把spark的bin包下面的python的所有都拷貝到(可能需要解壓py4j)

    %PYTHON%\Lib\site-packages下面去。這樣,你的編輯器才能找到。

    或者:

    配置你的編輯器的環(huán)境變量:

    PYTHONPATH=F:\home\spark-1.6.0-bin-hadoop2.6\python;F:\python2.7\Lib\site-packages

    使用spark-submit提交時用到其他類庫–py-filesxxxx/xxxx.zip,xxxx.py。

    以上內(nèi)容為大家介紹了Python培訓(xùn)之怎么用python寫spark,希望對大家有所幫助,如果想要了解更多Python相關(guān)知識,請關(guān)注IT培訓(xùn)機(jī)構(gòu):千鋒教育。

    聲明:本站稿件版權(quán)均屬千鋒教育所有,未經(jīng)許可不得擅自轉(zhuǎn)載。

    猜你喜歡LIKE

    python函數(shù)中的參數(shù)有哪些?

    2023-11-14

    python中pygal模塊如何使用?

    2023-11-14

    Python描述符中有哪三種方法?

    2023-11-14

    最新文章NEW

    如何使用python any()判斷多元素?

    2023-11-14

    python中doctest庫是什么?

    2023-11-14

    python模塊引入的三種方式

    2023-11-14

    相關(guān)推薦HOT

    更多>>

    快速通道 更多>>

    最新開班信息 更多>>

    網(wǎng)友熱搜 更多>>