第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號安全,請及時綁定郵箱和手機立即綁定

Python制作數(shù)據(jù)分析工具

Alex_Cen 產(chǎn)品經(jīng)理
難度初級
時長 1小時10分
學習人數(shù)
綜合評分9.17
20人評價 查看評價
9.2 內(nèi)容實用
9.1 簡潔易懂
9.2 邏輯清晰
  • 統(tǒng)計常規(guī)指標:

    1.均值、中位數(shù)、最大值、最小值等

    2.計數(shù)類(如統(tǒng)計某值出現(xiàn)多少)

    3.缺失值和方差等(方差太小沒有區(qū)分度,缺失值太多也一樣)

    4. 分位點、值得頻數(shù)等(不同的分位點的值相同的情況下,需要關注一下!值得頻數(shù)就是統(tǒng)計最經(jīng)常出現(xiàn)的值是誰,有什么比例等)


    查看全部
  • 數(shù)據(jù)的讀取

    查看全部
  • 數(shù)據(jù)? 診斷

    查看全部
  • 依賴包的導入

    查看全部
  • 數(shù)據(jù)分析依賴包

    查看全部
  • 數(shù)據(jù)診斷的目的

    查看全部
    0 采集 收起 來源:1.2 案例介紹

    2020-01-04

  • 1.?數(shù)據(jù)診斷的目的:

    1)?了解特征的分布,缺失和異常等情況。(了解了這些情況我們才能更好地做特征工程和數(shù)據(jù)預處理)

    https://img1.sycdn.imooc.com//5d54c6a600014a7505530196.jpg

    2)統(tǒng)計指標可直接用于數(shù)據(jù)預處理

    數(shù)據(jù)預處理就是指比如說特征缺失值的填充,缺失值的填充是建模常用的手段。填充的目的有很多。在填充的時候大家一般會采用很多種辦法。比如填一個0,-1,1這種常值進去,但是更多的人可能會填一些統(tǒng)計值,比如說中位數(shù)、眾數(shù)這樣的值進去。如果要用這種方法填數(shù)的話,一般需要對特征值重新計算一遍,如果每次都計算的話,這樣會影響整個模型的效率。更好的辦法:就是可以從前面預處理的過程和結果中把中位數(shù)和眾數(shù)取到,直接填到缺失里面去,這樣可以減少運行計算時間,因為我們只需要提取,不需要計算,這樣的話會減少耗時。除了這個以外,我們也有很多的判斷,比如數(shù)缺失值的比例,眾數(shù)的比例,也是形容特征工程的一個環(huán)節(jié)。當我們整個建模的流程形成之后,這些數(shù)據(jù)診斷的結果也可以起到判斷的作用。

    https://img1.sycdn.imooc.com//5d54c6c10001616606980254.jpg


    查看全部
    0 采集 收起 來源:1.2 案例介紹

    2020-01-04

  • 數(shù)據(jù)? 診斷

    查看全部
    0 采集 收起 來源:1.2 案例介紹

    2020-01-04

  • 依賴包包括:Numpy,Pandas,Scipy


    查看全部
  • 了解特征分布,缺失和異常

    統(tǒng)計指標可直接用于數(shù)據(jù)預處理


    查看全部
    0 采集 收起 來源:1.2 案例介紹

    2019-10-03

  • 清洗數(shù)據(jù),是必要之必要的,準備步驟要做好

    查看全部
    0 采集 收起 來源:1.2 案例介紹

    2019-08-19

  • 為了更高效地學習,這次嘗試從結果出發(fā)來學習 python,看不懂的部分,回頭再查找入門課程。

    依賴包-待安裝

    特殊值、描述值-待查概念

    查看全部
  • 1.缺失值不應該存在于EDA中。缺失值是通過分析得出來的。

    2.數(shù)據(jù)導入-》數(shù)據(jù)分析-》工具


    查看全部
    0 采集 收起 來源:5.1 課程總結

    2019-08-16

  • 1.# 2.Calculating Running time

    import timeit

    ?

    start = timeit.default_timer()

    df_eda_summary = eda_analysis(missSet=[np.nan, 9999999999, -999999], df=df.iloc[:, 0:3])

    print('EDA Running Time: {0:.2f} seconds'.format(timeit.default_timer() - start))

    上面是時間的測試示例,我們?nèi)y試每一塊所用時間,由此可以判斷我們的優(yōu)化重點,經(jīng)過測試可知,眾數(shù)部分的時間較長,所以我們后期可對這一部分進行優(yōu)化,優(yōu)化的方法有:1)注釋掉沒用的代碼 2)使用更好的方法去替代原有方法。


    查看全部
  • 1.整合核心代碼:?

    # 12.Combine All Information

    ????df_eda_summary = pd.concat(

    ????????[count_un, count_zero, df_mean, df_median, df_mode,

    ?????????df_mode_count, df_mode_perct, df_min, df_max, df_fre,

    ?????????df_miss], axis=1

    ????)

    ????# 左邊是特征,上邊是有多少統(tǒng)計描述,就拼多少


    查看全部
    0 采集 收起 來源:4.1 工具整合

    2019-08-16

舉報

0/150
提交
取消
課程須知
適合人群:希望從傳統(tǒng)分析人員轉型到數(shù)據(jù)挖掘和機器學習領域的人員;技術儲備:python基本知識,統(tǒng)計學基本知識
老師告訴你能學到什么?
1.用Python制作一個高效的數(shù)據(jù)診斷工具; 2.數(shù)據(jù)診斷的各種指標;

微信掃碼,參與3人拼團

微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網(wǎng)微信公眾號

友情提示:

您好,此課程屬于遷移課程,您已購買該課程,無需重復購買,感謝您對慕課網(wǎng)的支持!