機械学習モデルの評価指標|精度・適合率・再現率・F1スコアの使い方

機械学習モデルの性能評価に使う指標(精度・適合率・再現率・F1スコア・AUC)を正確に理解することで、モデル選択と改善方針の意思決定が適切になります。

混同行列(Confusion Matrix)

二値分類の結果を4つに分類した表:TP(真陽性)・FP(偽陽性)・FN(偽陰性)・TN(真陰性)。

主要な評価指標

精度(Accuracy)=(TP+TN)÷全サンプル。全体的な正解率。クラス不均衡時は誤解を招きやすい。適合率(Precision)=TP÷(TP+FP)。「陽性と予測したもの中で実際に陽性の割合」。偽陽性コストが高い場合(スパムフィルター等)に重視。再現率(Recall/Sensitivity)=TP÷(TP+FN)。「実際の陽性のうち正しく検出した割合」。偽陰性コストが高い場合(がん検診等)に重視。F1スコア=2×(適合率×再現率)÷(適合率+再現率)。適合率と再現率の調和平均。

AUC-ROC

異なる閾値でのTPRとFPRをプロットした曲線(ROC曲線)の面積。1に近いほど良い。クラス不均衡データの評価に有効。

まとめ

評価指標の選択は「どんなエラーが許容できないか」によって決まります。医療診断では再現率(見逃しを減らす)、メール分類では適合率(誤検出を減らす)を優先するというビジネス文脈の理解が最重要です。

エンジニア・技術者におすすめの書籍

技術力を上げたいエンジニアに、実践的な名著を厳選して紹介します。