問題來源:現(xiàn)在書上和網(wǎng)上的都是把一堆已知預(yù)測結(jié)果的數(shù)據(jù)集分為測試集和訓(xùn)練集,然后看預(yù)測結(jié)果和真實值之間的準(zhǔn)確率,報告什么的。。。。弱弱的問下,我有數(shù)據(jù)集,現(xiàn)在要對沒有結(jié)果的數(shù)據(jù)做結(jié)果預(yù)測。問題來了:請問怎么操作,待預(yù)測的數(shù)據(jù)要和訓(xùn)練集、測試集一起進行特征工程,怎么進行呢。也就是說如何把不帶預(yù)測結(jié)果的數(shù)據(jù)集和用來訓(xùn)練的放在一起做特征工程。然后求解預(yù)測結(jié)果。'''2 數(shù)據(jù)分割'''#分割數(shù)據(jù)集到訓(xùn)練集和測試集x_train,x_test,y_train,y_test= train_test_split(x,y,test_size=0.01)#進行處理(特征工程),使用特征轉(zhuǎn)換器進行特征抽取dict= DictVectorizer(sparse=False)# 類別型的數(shù)據(jù)會抽離出來 數(shù)據(jù)型的會保持不變x_train = dict.fit_transform(x_train.to_dict(orient='records'))
print(dict.get_feature_names())
x_test = dict.transform(x_test.to_dict(orient='records'))
print(x_train)'''3訓(xùn)練模型進行預(yù)測'''#用決策樹進行預(yù)測,初始化決策樹分類器dec = DecisionTreeClassifier(max_depth=12,min_samples_leaf=1)# 訓(xùn)練dec.fit(x_train,y_train)# 預(yù)測 保存結(jié)果y_predict = dec.predict(x_test)### 問題描述
添加回答
舉報
0/150
提交
取消