首頁猿問 python中運用sklearn的...

python中運用sklearn的決策樹模型求真實數(shù)據(jù)

Html5 Python

開滿天機 2019-03-02 18:22:36

問題來源：現(xiàn)在書上和網(wǎng)上的都是把一堆已知預(yù)測結(jié)果的數(shù)據(jù)集分為測試集和訓(xùn)練集，然后看預(yù)測結(jié)果和真實值之間的準(zhǔn)確率，報告什么的。。。。弱弱的問下，我有數(shù)據(jù)集，現(xiàn)在要對沒有結(jié)果的數(shù)據(jù)做結(jié)果預(yù)測。問題來了：請問怎么操作，待預(yù)測的數(shù)據(jù)要和訓(xùn)練集、測試集一起進行特征工程，怎么進行呢。也就是說如何把不帶預(yù)測結(jié)果的數(shù)據(jù)集和用來訓(xùn)練的放在一起做特征工程。然后求解預(yù)測結(jié)果。'''2 數(shù)據(jù)分割'''#分割數(shù)據(jù)集到訓(xùn)練集和測試集x_train,x_test,y_train,y_test= train_test_split(x,y,test_size=0.01)#進行處理（特征工程），使用特征轉(zhuǎn)換器進行特征抽取dict= DictVectorizer(sparse=False)# 類別型的數(shù)據(jù)會抽離出來數(shù)據(jù)型的會保持不變x_train = dict.fit_transform(x_train.to_dict(orient='records')) print(dict.get_feature_names()) x_test = dict.transform(x_test.to_dict(orient='records')) print(x_train)'''3訓(xùn)練模型進行預(yù)測'''#用決策樹進行預(yù)測,初始化決策樹分類器dec = DecisionTreeClassifier(max_depth=12,min_samples_leaf=1)# 訓(xùn)練dec.fit(x_train,y_train)# 預(yù)測保存結(jié)果y_predict = dec.predict(x_test)### 問題描述

查看完整描述