More Related Content
状態と状態遷移に着目したゴール指向要求分析手法の考察 Rによる特徴抽出 第48回R勉強会@東京(#TokyoR) Yahoo! JAPANにおけるオンライン機械学習実例 #streamctjp More from Michitaro Okano (19)
機械学習によるモデル自動生成の一考察 ー 決定表と決定木によるアプローチ - GSNを利用したゴール指向要求分析における要求間の依存性の検証手法に関する提案 機械学習活用のための要求分析手法の研究 AI版酒屋倉庫問題のケース ゴール指向要求分析における不確かさの考察 ~ IoT・AIのケース ~ IoT活用システムへのゴール指向要求分析の適用に関する考察 AI・機械学習の活用におけるソフトウェア工学の今後の課題~ノンプログラミングで作成する予測APIの事例から~ ゴール指向分析KAOSにおける依存性を考慮した要求抽出法の考察 ゴール指向要求分析における構成要素に着目した分解に関する一考察 A study on the or decomposition of goal-oriented analysis using GSN 仮説とデータ解析の関係2
- 5. 仮説構築における統計・機械学習
• 目的変数が連続量
– 回帰
– 指標を作りたい場合は、主成分分析
• 目的変数がカテゴリーデータで、カテゴリー値全ケー
ス存在→因子を探す・仕組みを探す
– 機械学習:決定木
– 統計:探索的因子分析
• 目的変数がはっきりしない→グループ分け
– クラスタリング:階層型・非階層型(k-meansなど)
– ※例えば、故障予知の場合、故障していなければ、決定
木は使えない。しかし、クラスタリングして、外れているグ
ループを出すことはできる
5
- 6. 2.仮説検証におけるデータ処理
• 事例
– Setosaの分類には、
Sepal.Length,Sepal.Widt
hは寄与しない
• 手法
– Sepal.Length,Sepal.Widt
hを含むモデルと含まな
いモデルでAICを比較
• 結果
– 寄与させないほうがAIC
が低い=寄与しない
• Rの処理
6
install.packages("lavaan")
library(lavaan)
#データよみこみ
data<-read.csv("iris1.csv",header=T)
#寄与しない場合のモデル
mymodel<-'
y1~x3+x4
y2~x3+x4
y1~~y1
y2~~y2
'
fit<-sem(mymodel,data)
summary(fit)
AIC(fit)
#寄与する場合のモデル
mymodel<-'
y1~x3+x4+x1+x2
y2~x3+x4+x1+x2
y1~~y1
y2~~y2
'
fit<-sem(mymodel,data)
summary(fit)
AIC(fit)
共分散構造分析の
方法を示すために
lavaanを使った。こ
の場合はロジス
ティック回帰を用い
るのが妥当。
ただし、今回はロジス
ティック回帰を行うと
詳しくはゼミで
- 8. 3.仮説活用におけるデータ処理
• 事例
– 作成した決定木を活用し
て、予測してみる
• 手法
– Iris中、setosa、versicolor、
virginicaのデータ2つづつ
取り出し、予測する
– 残りのデータを学習データ
とする
• Rの処理
• 結果
8
check<-read.csv("ck.csv",header=T)
data<-read.csv("tr.csv",header=T)
library(rpart)
model <- rpart(Species ~ .,data=data,minsplit = 5,cp=0.001)
predict(model, check, decision.values = TRUE)
予測の評価をする場合には、実際
にはクロスバリデーションを行う。
詳しくはゼミで