PMML (Predictive Modeling Markup Language)是由 Data Mining Group (DMG) 開發, 以 XML 為基礎來定義預測模型的語言。) DMG是由商家主導的團體,專門負責開發數據採礦標準。這套標準是以商家中立的方式,因此模型在不同應用程式間交換時不會因所有權事宜而產生問題。在這種方式下,不論使用哪套應用程式來建立您的預測模型,均可輕易轉換為PMML及上傳至ADAPA® 執行。
ADAPA®使用PMML 3.2。以下範例除模型檔外,我們亦提供包含輸入及預測值的數據檔。這些檔案用於執行模型時,將ADAPA的計算結果和檔案中的預測值比較,以進行模型驗證。
如要以這些範例進行試驗,請遵照以下步驟:
- 將模型和數據檔儲存於本機電腦
- 上傳在ADAPA Demo中的模型檔案
- V透過執行相應的數據檔驗證模型
以下示例是以公開的數據集為基礎的:
| 模型類型 | PMML 模型檔 | 數據集 | 二元分類神經網絡 (Neural Network for binary classification) |
Audit_NN.xml | Audit_NN.csv |
|---|---|---|
| 二元分類的支援向量機器 (Support Vector Machine for binary classification) |
Audit_SVM.xml | Audit_SVM.csv |
| 類神經網路 (Neural Network) |
ElNino_NN.xml | ElNino_NN.csv |
| 多級分類的類神經網路 (Neural Network for multi-class classification) |
Iris_NN.xml | Iris_NN.csv |
| 多級分類的支援向量機器 (Support Vector Machine for multi-class classification) |
Iris_SVM.xml | Iris_SVM.csv |
| 多項分類邏輯回歸(普通回歸) (Multinomial Logistic Regression (General Regression)) |
Iris_MLR.xml | Iris_MLR.csv |
| 廣義線性模型(普通回歸) (Generalized Linear Model (General Regression)) |
Shuttle_GZLM.xml | Shuttle_GZLM.csv |
| 決策樹 (回歸) (Decision Tree (Regression)) |
ElNino_RT.xml | ElNino_RT.csv |
| 決策樹 (分類) (Decision Tree (Classification)) |
Iris_CT.xml | Iris_CT.csv |
| K-Means Clustering | Iris_KM.xml | Iris_KM.csv |
| Naive Bayes | NaiveBayes.xml | NaiveBayes.csv |
鳴謝:
DMG刊載許多PMML範例模型,這有助我們收集在此展示的PMML 3.2範例。
有關Iris和El Nino數據集的進一步資料請參考:Asuncion, A. & Newman, D.J. (2007). UCI Machine Learning Repository.UCI Machine Learning Repository.加州大學 Irvine分校的資訊及電腦科學學院。
核對(Audit) 數據集可透過R rattle套裝取得。有關rattle的進一步資料可參考http://rattle.togaware.com.
太空船O形環數據是來自挑戰者號災難發生前一些太空船飛行時O形環故障的資料)。爆炸的原因確定為右邊推進器出現一個O形環故障。挑戰者號災難已成為因數據分析不足而可能帶來嚴重後果的個案研究。


