機械学習入門｜scikit-learnで学ぶ分類・回帰・クラスタリング

著者：副業の宮殿｜製造業に携わる現役エンジニア。技術士試験対策書籍をKindleで複数出版。技術ブログ「副業の宮殿」にて製造業DX・AI活用の情報を発信中。

機械学習の3つの種類

種類	概要	例
教師あり学習	ラベル付きデータで学習	スパム判定・価格予測
教師なし学習	ラベルなしで構造発見	顧客セグメント・異常検知
強化学習	報酬を最大化する行動学習	ゲームAI・ロボット制御

scikit-learnの基本パターン

scikit-learnは一貫したAPIで様々なアルゴリズムを提供します。

from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score

# データ分割
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.2, random_state=42
)

# 前処理
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test  = scaler.transform(X_test)

# モデル学習・予測（共通パターン）
model.fit(X_train, y_train)
y_pred = model.predict(X_test)
print(accuracy_score(y_test, y_pred))

分類（Classification）

from sklearn.ensemble import RandomForestClassifier

model = RandomForestClassifier(n_estimators=100, random_state=42)
model.fit(X_train, y_train)

# 特徴量重要度
importances = pd.Series(model.feature_importances_, index=features)
importances.sort_values().plot(kind='barh')

回帰（Regression）

from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error
import numpy as np

model = LinearRegression()
model.fit(X_train, y_train)

y_pred = model.predict(X_test)
rmse = np.sqrt(mean_squared_error(y_test, y_pred))
print(f"RMSE: {rmse:.2f}")

クラスタリング（Clustering）

from sklearn.cluster import KMeans

kmeans = KMeans(n_clusters=3, random_state=42)
clusters = kmeans.fit_predict(X)

# エルボー法でクラスター数を決定
inertias = []
for k in range(1, 11):
    km = KMeans(n_clusters=k).fit(X)
    inertias.append(km.inertia_)

モデル選択のガイドライン

データが少ない → ロジスティック回帰・SVM
解釈性重要   → 決定木・線形モデル
精度重視     → ランダムフォレスト・XGBoost
非構造データ  → ディープラーニング（scikit-learn外）

過学習の防止

交差検証：cross_val_scoreで汎化性能確認
正則化：Ridge・Lasso（線形モデル）
早期終了：勾配ブースティング
データ増強：訓練データを人工的に増やす

Kaggleの入門コンペで実データを触ることが機械学習上達の最速ルートです。

エンジニアのためのプロジェクト管理基礎：QCD管理とWBS活用法

技術者がプロジェクトリーダーや主担当として開発・改善プロジェクトを進める際に必要なプロジェクト管理の基礎を解説します。プロジェクト管理の核心はQCD（Quality・Cost・Delivery）の同時達成です。①WBS（Work Breakdown Structure、作業分解構造）：プロジェクト全体の作業を細分化して階層的に整理したツール。全作業が漏れなく洗い出せ、担当者・期限・成果物が明確になります。②ガントチャート：WBSの各タスクをカレンダー上に展開し、依存関係・重要パスを可視化します。Microsoft ProjectやExcel・GanttProject（無料）で作成可能。③リスクレジスター：プロジェクトで発生しうるリスクとその対応策を一覧化。定期的な見直しで予期しない問題への備えが生まれます。技術士試験の論文でもプロジェクトマネジメントは頻出テーマです。PMP（Project Management Professional）などのPM資格もエンジニアのキャリアアップに有効な選択肢です。

ものづくりの強みを活かしたイノベーション創出の方法

日本の製造業が直面する課題の一つが「技術力はあるが革新的な製品が生まれにくい」という問題です。ものづくりの強みを活かしてイノベーションを生み出すためのアプローチを解説します。①ユーザー観察（エスノグラフィー）：製品の使用現場に直接赴き、顧客が実際にどう使っているかを観察することで、顧客自身も言語化できていない潜在ニーズを発見できます。②クロスインダストリー発想：他業界（航空宇宙・医療・食品等）で使われている技術・プロセスを自社の課題に適用する「転用発想」。③技術的制約からの逆転発想：「〇〇が難しい」という制約を「だからこそ〇〇できる」というユニークな価値に転換する。④デザイン思考の活用：共感→問題定義→アイデア創出→プロトタイプ→テストという5ステップで新製品開発に臨む。これらの手法を組み合わせることで、技術力を市場価値のあるイノベーションに転換できます。

エンジニアとして技術力を高め続けるための学習戦略

技術の進化が加速する現代において、エンジニアとして市場価値を維持・向上させるには戦略的な学習が不可欠です。効果的な技術習得のための3つのアプローチを紹介します。①インプットとアウトプットの循環：技術書や論文を読むだけでなく、習得した技術を実際に使った成果物（プロジェクト・ブログ記事・社内発表）を作ることで、知識が定着します。「作ることで初めて本当に理解できる」が技術習得の本質です。②T字型スキルの構築：1〜2つの専門分野を深く・その周辺分野を広く学ぶT字型スキルが、現代エンジニアに求められるプロファイルです。機械設計なら「設計×材料×制御×AI活用」のような複合スキルが付加価値を生みます。③実務での適用を意識した学習：「この知識を明日の仕事にどう使うか」を常に意識することで、学習の優先順位が明確になり、習得スピードが上がります。技術士試験の受験も、体系的な知識習得と資格取得を同時に達成できる有効な手段です。

製造現場のAI活用で変わる仕事の未来

製造業においてAI・IoT・ロボティクスの活用が急速に進んでいます。エンジニアとして、これらの技術変化に適応するための視点を整理します。AIが代替しやすい業務は①定型的なデータ入力・集計②パターン認識型の品質検査③単純な報告書の作成です。一方、AIが苦手とする業務は①現場の文脈・暗黙知を必要とする判断②クライアントや社内の人間関係を踏まえた調整③新しい課題に対する創造的なアプローチです。AIを「自分の能力を増幅させるツール」として使いこなすエンジニアが、今後最も価値を持つ存在になります。ChatGPTやClaude Codeを使った設計計算・技術文書作成・データ分析の効率化を積極的に取り入れることが、AI時代のエンジニアとしての第一歩です。

工場の安全管理を強化するリスクアセスメントの実践

工場の安全事故ゼロを実現するためには「危険に気づく眼」を持ち、リスクを事前に評価・対策するリスクアセスメントが重要です。リスクアセスメントの基本手順：①ハザード（危険源）の特定：作業場所・機械・化学物質・電気・高所など潜在的な危険を全て列挙。②リスクの見積もり：発生可能性（頻度）×ひどさ（重篤度）でリスクレベルを評価（例：高・中・低）。③リスク低減措置の決定：「本質的安全設計→安全防護→警告→教育・訓練・作業手順」の優先順位で対策を選択。④残留リスクの評価・記録：対策後の残留リスクを確認し文書化する。労働安全衛生法ではリスクアセスメントの実施が一部業種で義務付けられており、製造業は対象に含まれます。年1回以上のリスクアセスメント実施・記録・見直しが法令上推奨されています。ヒヤリハット報告制度と組み合わせることで、ゼロ災害活動の実効性が上がります。

製造コスト削減に役立つVA/VE活動の基礎

VA（Value Analysis、価値分析）・VE（Value Engineering、価値工学）は製品・工程のコスト削減と機能向上を同時に実現するための体系的手法です。VAは既存製品のコスト削減、VEは開発段階での設計最適化に使われます。VEの基本式：価値（V）＝機能（F）÷コスト（C）。価値を高めるには①機能を維持してコストを下げる②コスト一定で機能を高める③コストを下げながら機能も高める、の3方向があります。実践的なVA/VE活動の進め方：①機能定義（製品・部品が持つべき機能を動詞＋名詞で定義）②機能評価（各機能に対するコスト配分を確認）③代替案の発想（ブレーンストーミングで機能を実現する別の方法を発想）④代替案の評価・選定（技術的実現性・コスト・品質・納期で評価）。設計段階でVEを実施すると、後工程での設計変更コスト（製造・市場での対策コスト）を最小化できます。

おすすめ書籍・サービス

▶ 技術士試験突破の極意！過去問で磨く合格力【Kindle版】

▶ 旋盤の基礎：初心者のための実践ガイド【Kindle版】

▶ 令和2年度技術士第一次試験基礎科目【Kindle版】

▶ エンジニアのための鉄鋼・材料工学入門【Kindle版】

【管理人の独り言】

【管理人メルマガ】副業でも稼げるヒミツ

【管理人メルマガの宣伝　終わり】

機械学習入門｜scikit-learnで学ぶ分類・回帰・クラスタリング

機械学習の3つの種類

scikit-learnの基本パターン

分類（Classification）

回帰（Regression）

クラスタリング（Clustering）

モデル選択のガイドライン

過学習の防止

エンジニアのためのプロジェクト管理基礎：QCD管理とWBS活用法

ものづくりの強みを活かしたイノベーション創出の方法

エンジニアとして技術力を高め続けるための学習戦略

製造現場のAI活用で変わる仕事の未来

工場の安全管理を強化するリスクアセスメントの実践

製造コスト削減に役立つVA/VE活動の基礎

コメントを残すコメントをキャンセル

【管理人の独り言】

【管理人メルマガ】副業でも稼げるヒミツ

【管理人メルマガの宣伝 終わり】

機械学習の3つの種類

scikit-learnの基本パターン

分類（Classification）

回帰（Regression）

クラスタリング（Clustering）

モデル選択のガイドライン

過学習の防止

エンジニアのためのプロジェクト管理基礎：QCD管理とWBS活用法

ものづくりの強みを活かしたイノベーション創出の方法

エンジニアとして技術力を高め続けるための学習戦略

製造現場のAI活用で変わる仕事の未来

工場の安全管理を強化するリスクアセスメントの実践

製造コスト削減に役立つVA/VE活動の基礎

関連記事

コメントを残す コメントをキャンセル

【管理人メルマガの宣伝　終わり】

コメントを残すコメントをキャンセル