人に追従する移動ロボットの学術文献調査と技術整理
エグゼクティブサマリ
人に追従する移動ロボット(human‑following / person‑following mobile robots)は、(i) 対象人物の検出・追跡(必要なら Re‑ID で特定人物追従)、(ii) 相対目標(距離・方位・並走位置など)の生成、(iii) 障害物回避を含む局所計画・制御を、リアルタイムに統合することで成立する。文献を俯瞰すると、性能を決めるボトルネックは「移動ロボット上の視点変化・遮蔽・近距離(被写体が画面からはみ出す)・照明変動・混雑」に対して、追跡が破綻しないこと(ID switch を抑える)と、破綻しても再捕捉・再同定(Re‑ID)できることにある。
センサ構成は大きく、2D LiDAR(脚/下腿クラスタ)中心、RGB/RGB‑D(検出器+深度で距離)中心、単眼(幾何仮定+状態推定で距離推定)中心、および**融合(RGB‑D+LiDAR、あるいは LiDAR+地図+視覚)**に分かれる。2D LiDAR 追跡は照明に強く計算も軽い一方、識別情報が乏しく混雑でのデータ関連付けに弱い。RGB/RGB‑D は識別(服装・外観・骨格)に強いが、遮蔽・照明・モーションブラーの影響を受けやすい。単眼はコスト面で魅力的だが、距離推定の不安定さを、地面仮定・人体寸法仮定・フィルタ(KF/UKF)で補う流れが主流である。
制御は、ロボットベースを微分駆動(unicycle 近似)とみなした上で、誤差(距離誤差・方位誤差)を PID/PD で整形する古典制御が実装容易で依然強い(ベンチマークでも有効)。一方で、追従は「目標が常に動く」ため、局所計画を含めて**(拡張)DWA のような “近未来評価(リシーディングホライゾン)”**で最適化する設計が、障害物回避・社会的配置(後方追従、斜め後方追従など)と相性がよい。さらに、仮想ばね(virtual spring)で人—ロボット相対運動のギャップを吸収する制御則や、予測を組み込む MPC 系の枠組みも、追従の滑らかさ・追従遅れ低減の観点で重要な系譜を形成している。
実装面では、ROS エコシステムの成熟により、2D LiDAR 脚追跡(例:leg_detector)、マルチモーダル人物追跡(SPENCER)、動的目標追従のナビゲーション(Nav2 Follow Dynamic Point / Following Server)など、研究成果を現場実装に落とす部品が揃ってきた。論文側でも、追跡器+追従コントローラを ROS パッケージとして公開する例があり、再現性を押し上げている。
目的・適用場面とシステム要件
人追従ロボットの目的は、単なる “追いかける” に留まらず、**運搬(荷物・工具)、案内(ガイド)、同行(介助・見守り)、遠隔存在(テレプレゼンス)、作業支援(ワーカ追従)**のように「人のタスクを中断させずに移動支援する」ことにある。たとえばテレプレゼンスでは、操作者が会話に集中できるよう追従の自律化が有効で、ユーザスタディでも自律追従が好まれるという報告がある。
設計要件は、用途により強弱が変わるが、移動ロボットとして共通に次が支配的になる。第一に、安全(衝突回避、対人距離の維持、停止挙動の確実性)。第二に、追従のロバスト性(遮蔽、混雑、外観変化、近距離での観測欠落、照明変動)。第三に、**自然さ(振動のない速度指令、過度な蛇行回避、社会的に受け入れられる位置取り)**である。追従距離を一定に保つだけでも、遅れやノイズで振動し得るため、デッドバンドや減速則を工夫する例がある。
センサ構成と知覚パイプライン
センサ構成は「対象人物の位置(相対座標)をどの観測モデルで安定に出すか」と「識別(特定人物)をどの情報で担保するか」に直結する。
センサ別の主要パターン
視覚単独(単眼)は、コストと屋外適用性で魅力がある一方、距離推定が難しい。そのため、骨格検出(例:OpenPose 系)で人体のキー点を得て、**地面平面仮定+人体寸法(身長)推定+状態推定(UKF)**で “ロボット座標系の人物位置” を構成する枠組みが提案されている。距離が大きいほどピクセル量子化や足首位置の揺れが効くため、UKF で軌跡を平滑化し、一定距離内で実用精度に寄せる評価が示されている。
RGB‑D は深度が直接距離に効くため人物位置推定が組みやすい。テレプレゼンス追従では、深度画像でクリック選択した人物の頭部位置を推定し、レーザの脚追跡を起動する融合設計が採用されている。
LiDAR(特に 2D)は脚・下腿クラスタ追跡が古典で、照明に依存せず、動作が軽い。追跡精度と ID switch を評価指標(CLEAR MOT)で整理し、追従用ベンチマークを公開した研究もある。
融合は、混雑と遮蔽に強くなりやすい。RGB‑D+LiDAR を統合し、行動木(Behavior Tree)で「見失い→探索→再捕捉」を含む設計にする例が報告されている。
典型アーキテクチャと情報フロー
以下は、移動ロボットの人追従でよく現れるモジュール分割である(論文の構成例:ステレオ+地図+ランダム化計画の統合、RGB‑D+LiDAR+計画、単眼+追跡+Re‑ID+制御、など)。
flowchart LR
S[Sensor Layer\nMono/RGB-D/LiDAR/IMU-Odom] --> P[Perception\nDet/Pose/Segmentation]
P --> T[Tracking & State Estimation\nKF/UKF + Data Association]
T --> I[Target ID / Re-ID\nOnline learning / Metric]
T --> G[Relative Goal Generation\nfollow distance/angle/side-by-side]
I --> G
G --> PL[Local Planning\nDWA/RRT/MPC/Nav stack]
PL --> C[Low-level Control\nPID/PD/Virtual spring]
C --> U[cmd_vel (v, ω)]
U --> R[Mobile Base]
R --> S
検出・追跡・Re‑IDの手法整理
検出器と観測表現
検出は、(a) LiDAR スキャンのクラスタリング+幾何特徴分類(脚らしさ)、(b) 画像の人物検出(バウンディングボックス、インスタンスセグメンテーション)、(c) 骨格(関節点)推定、に大別できる。LiDAR 追跡ではクラスタの幾何特徴と分類確信度を用い、フレーム間はフィルタとデータ関連付け(GNN 等)で安定化する設計が示されている。
視覚系では、人物の検出・特徴抽出・オンライン更新が鍵になる。屋内追従の一例では、SSD で人物検出・追跡を行い、HSV ヒストグラムの色特徴でターゲット同定、さらに LiDAR SLAM で障害物回避まで統合した状態機械(state machine)設計が報告されている。
“部分遮蔽” を正面から扱う研究では、バウンディングボックス(YOLOX)と関節点(AlphaPose)を同時に検出し、可視な関節集合 (P) を観測として扱う定式化が提示されている。観測 (D={B,P}) とし、(B) はバウンディングボックス中心・幅・高さ、(P) は頸部・腰・膝・足首などの可視関節点集合としてモデル化する。
追跡器とデータ関連付け
追跡器は、KF/UKF を中核に、複数人物ではデータ関連付けが支配的になる。2D LiDAR ベースの追跡では、スキャン点のクラスタを全て追跡し、占有グリッドと整合する位置にトラックを制約することで、混雑・障害物近傍の誤関連付けを抑える設計が示されている。追従用ベンチマークでは MOTA/MOTP を用いて、既存 ROS leg_detector に対して ID switch と精度の改善を報告している。
単眼ベースでは、画像平面からロボット座標系に人物位置を落とす段が難所となる。近距離では全身が写らないため “高さ仮定” だけでは破綻しやすく、幅情報(バウンディングボックス幅)を距離推定の prior に使う設計が提案されている。この枠組みでは、バウンディングボックス情報から “処理済み観測” (y_k) を構成し、予測状態 (o_i) と (y_j) の距離 (d(i,j)=|o_i-y_j|_2^2) で関連付けし、GNN(Global Nearest Neighbor)でマッチングする流れが明示されている。
Re‑ID(特定人物追従)とオンライン適応
特定人物追従では「一度見失っても、別人に乗り換えずに再捕捉する」ことが要求になる。単眼・移動ロボット文脈では、外観特徴にオンライン学習を組み合わせ、識別に効く部位(例:ズボン)へ重み付けを寄せる発想が整理されている。
FollowMe 系の統合フレームワークでは、人物検出(YOLACT++)→Re‑ID(深層特徴)→深度で 3D 位置化→Kalman Filter で平滑化→ナビゲーションで追従、という “知覚〜移動” を一貫させる。Re‑ID は、キャリブレーションで集めた特徴分布(平均・分散)に対し、特徴ベクトル (f) の正規化距離(成分ごとの標準化距離の形)でターゲット判定し、しきい値で弾く式が明示されている。
制御アルゴリズムと障害物回避・経路計画
追従モデルと誤差モデル
多くの移動ロボットは平面上で unicycle 近似(状態 (x,y,\theta)、入力 (v,\omega))され、追従誤差はロボット座標系の相対位置 ((x_h,y_h)) から「距離誤差」「方位誤差」に落とす。実装上は、(i)追従距離の一定化、(ii)横ずれ((y_h))のゼロ化、(iii)必要に応じて並走オフセット付与(側方追従)をする。単眼追従の枠組みでも、ロボット座標系で (x) を目標値に保ち、(y) を 0 に収束させる方針が明示され、制御は PID を採用している。
PID/PD 系の代表
距離制御を “デッドゾーン付き比例+人速度フィードフォワード” として設計し、角度を PD で制御する例がある。具体的には距離誤差 (\Delta d_t=d_t^* - d_t) に対し [ v_d= \begin{cases} 0 & d_t \in \text{death zone}\ -K_p\Delta d_t + K_s v_h & \text{otherwise} \end{cases} ] のように速度指令を構成し、角度誤差 (\Delta \theta_t=\theta_t^*-\theta_t) に対して [ \Delta v=\left(K_P^{ang}\Delta\theta_t + K_D^{ang}\dot{\Delta\theta}_t \right)\frac{D}{2} ] の形で左右輪速度差を作る((D):輪距)。この系は、ロボット速度制限や応答遅れに起因する振動を抑えるため、減速度を距離(および角度制御量)に応じて適応させる工夫まで含む。
2D LiDAR 追跡+追従制御でも、目標位置ベクトルと人物位置ベクトルの “角度差” と “長さ差(距離差)” をそれぞれ PID に入れ、角速度と並進速度を独立に整形する設計が明示されている。
仮想ばね(virtual spring)とインピーダンス的設計
仮想ばねモデルは「人とロボットが仮想的なばねで接続され、その弾性力(伸び・曲げ)に応じてロボット速度が決まる」という考え方で、歩行の急な速度・方向変化をローパス的に吸収する狙いが明確である。代表例では、座標変換後にばねの変形量を幾何量として近似し、伸び方向・曲げ方向の弾性力から移動体の並進・回転の運動方程式を導く(ばね係数、粘性摩擦、モーメント等を含む)。追従パターン(後方だけでなく並走など)を、ばねの取付角の設定で作れる点も示されている。
組込み指向の RGB‑D 追従でも、検出・追跡(CamShift 改良)と組み合わせて、仮想ばねモデル(安全領域・能動領域)を使い滑らかな追従に落とす設計が報告されている。
局所計画・DWA 拡張と “近未来最適化”
“追従” は目標(人物)が常に動くため、固定ゴール前提の計画では再計画頻度が過大になる。そのため、許容速度集合を前方シミュレーションして最良行動を選ぶ Dynamic Window Approach(DWA)系の考え方を、動的ゴール追従へ拡張する設計がある。テレプレゼンス追従の研究では、ロボット状態更新式(構成 (q) と行動 (a) による離散時間遷移)を用いて深さ制限付き木探索を行い、割引和の効用 [ U_{t_n}=\sum_{t=0}^{t_n}\beta^{t},u_t(\cdot) ] [ u_t = w_g g(q_t,p_t)+w_o(1-c_o)+w_a(1-c_a)+w_v(1-c_v) ] の形で、目標関数(人との相対位置の望ましさ)と障害物・加速度・曲率(角速度)等のコストを統合し、未来も見据えた追従を構成している。
ランダム化計画の系譜では、人物位置を局所目的地としつつ、静的障害物と動的障害物(他者)を入れた状態空間で、制限時間内にランダム木を展開し最良パスを選ぶ。例として、葉ノード評価を [ k^*=\arg\max_k{w\hat{B}(k)+(1-w)V(k)} ] (ポテンシャル増分と平均速度の重み付け)で行い、毎サイクル(500ms)で計画→実行する統合設計が報告されている。
MPC と予測の組込み
予測を組み込む設計は、「現在位置フィードバックだけでは追従遅れが積み上がる」という問題意識から出る。作業者の将来位置を予測し、MPC のリシーディングホライゾンで有限未来の評価関数(終端+ステージコスト)を最適化して軌道を生成する枠組みが提示されている。人の運動予測には GMR(Gaussian Mixture Regression)を用い、予測分布列を生成する手順が具体的に示されている。
評価指標・実験設定・ベンチマーク
評価は「追跡(tracking)評価」と「追従(following)評価」に分けると整理しやすい。
追跡評価では、MOTA/MOTP(CLEAR MOT)や ID switch、miss、FP を用いる例があり、MOTA は [ \mathrm{MOTA}=1-\frac{\sum_k(\mathrm{ID}_k+\mathrm{Miss}_k+\mathrm{FP}k)}{\sum_k g_k} ] MOTP は [ \mathrm{MOTP}=\frac{\sum{i,k} d_k^i}{\sum_k c_k} ] (マッチ距離平均)として定義される。追従タスクでは特に **ID switch(別人への乗り換え)**と **miss(見失い)**が致命的になりやすい、という議論も併記される。
追従評価では、平均追従距離、距離の時系列(見失い時の挙動含む)、衝突回数、再捕捉成功率、追従継続時間などが使われる。テレプレゼンス追従の例では、複数走行の平均追従距離(例:全7走行の平均 1.16m)や、見失い点での再初期化が時系列で示されている。
実験環境は、屋内(廊下・食堂・研究室)と屋外で難易度が大きく変わる。屋外は LiDAR が日射でノイズを受けやすい等の課題がベンチマーク収集の記述として明確化されている。
代表論文の比較表(10本以上)
下表は、移動ロボットの人追従を「知覚〜制御〜評価」まで含めて議論している代表的文献を中心に、指定の観点で整理したものである(※制御式は、論文で明示されている主要式を優先し、記述のみの場合は “構造式(入力と誤差の関係)” として要約)。
| 代表論文 | 目的・主貢献 | 使用センサ/手法要点(検出・追跡・Re‑ID) | 制御則の数式要約(主要式) | 実験条件と評価結果 | 長所・短所 |
|---|---|---|---|---|---|
| Morioka 2004(IEEE TIE) | 分散センサ環境(Intelligent Space)で、人に負担をかけず安定追従する制御則を提案(仮想ばね)。 | 環境側の複数カメラ(DIND)で人・ロボットを計測し、追従制御へ供給。 | 人とロボットを仮想ばねで接続し、伸び・曲げ弾性力から並進・回転ダイナミクスを導出(運動方程式を含む)。 | 実機+シミュレーションで追従有効性を確認、追従パターンの切替(後方/並走等)も示す。 | 長所:非ホロノミック制約を“吸収”する設計思想、追従の滑らかさ。短所:環境インフラ依存で一般移動体への移植が難しい。 |
| Miura 2010(IAS) | 特定人物追従を、視覚追跡+地図+オンラインランダム化計画で統合し、遮蔽や他者を含む環境で実証。 | ステレオで人物検出・追跡、LRF で地図生成、オンラインの randomized kinodynamic planning。 | 葉ノード選択 (k^*=\arg\max{w\hat{B}(k)+(1-w)V(k)})(ポテンシャル増分と平均速度)。500ms周期で計画→実行。 | 126フレームで最大3人、追跡成功率96%。大学食堂で10回以上実験し、平均ロボット速度≈0.3m/sで追従成功。 | 長所:地図・他者を含む“統合”が明確。短所:計画の確率性、実装複雑(RTミドルウェア前提)。 |
| Cai & Matsumaru 2014(JRM/J‑Stage) | 2D LR センサで人検出・追従し、速度制限下でも安定追従する制御(death zone+減速適応)と障害物回避を提示。 | LRセンサで人(下肢)追跡+Kalman 状態空間(人位置・速度・加速度)。障害物検出用 LR も仮定。 | 速度:(\Delta d_t=d_t^*-d_t)、(v_d=0)(death zone)/ (-K_p\Delta d_t+K_s v_h)(外)。角度:PD で左右輪差 (\Delta v = (K_P^{ang}\Delta\theta +K_D^{ang}\dot{\Delta\theta})D/2)。 | 追従サンプリング500ms、最大速度0.5m/s等の設定。盲廊下や遮蔽・動的障害物(通行人)で軌跡評価。最大距離4m超でも前進継続など挙動を記述。 | 長所:速度制限・遅れを明示的に扱う制御設計。短所:設定依存(aim point 等)、歩行者密集での識別は弱い。 |
| Cosgun 2013(ICRA) | テレプレゼンスで“会話しながら追従”を成立させるため、DWA拡張の近未来効用最大化計画+ユーザスタディを実施。 | Kinect で人物選択・頭部推定→LRF で脚追跡(Mahalanobis 距離)→将来も考慮した局所計画。 | 離散遷移 (q_{t+\Delta t}=f(q_t,a)) と、割引効用 (U=\sum \beta^t u_t)、(u_t=w_g g+w_o(1-c_o)+w_a(1-c_a)+w_v(1-c_v))。 | 7走行で平均追従距離=1.16m。10名ユーザスタディで全員が自律追従を選好、統計差も報告。 | 長所:社会的配置を goal function で設計可能、評価が多面的。短所:センサ融合・UI前提があり一般化に注意。 |
| Leigh & Pineau 2015(ICRA) | 2D LiDAR で多人追跡を強化し、追従用ベンチマーク(ROS有効)と ROSパッケージ公開を含めて体系化。 | クラスタ特徴+RF分類、KF+GNN関連付け、占有グリッド整合で追跡を安定化。追従は OFC(PID×2)。 | 角速度:角度誤差の PID、速度:距離誤差の PID(Z‑N tuning、デッドバンド)。MOTA/MOTP定義も明示。 | データ合計40分。追従用屋内21m24s・屋外12m00s等、平均追従距離(例:1.33±0.57m)と追跡指標(ID switch 等)を提示。 | 長所:評価指標・データ・実装公開で再現性が高い。短所:LiDAR単体は Re‑ID が弱く“特定人物”には追加設計が必要。 |
| Koide 2020(RAS preprint) | 単眼のみで人物追跡+識別を成立させ、安価センサで person following を可能にする枠組みを提案。 | OpenPose で骨格検出→地面平面+身長推定で robot space 追跡→UKF+GNN関連付け→CCF+オンライン boosting で Re‑ID。 | 追跡側は UKF により足首点の揺れ・量子化を抑制(式は本文の状態推定枠組みに依存)。追従制御は “推定位置に基づき距離維持” の構造を前提。 | UKF有無で軌跡誤差を距離別に比較し、2m程度が最小検出距離、20m超で過大推定傾向などの実験的性質を報告。 | 長所:単眼+オンライン Re‑ID の実装指針が明確。短所:距離推定の仮定・キャリブレーションに依存、計算資源制約が課題。 |
| Kim 2018(arXiv) | “見失い→能動探索→再捕捉” を含むアーキテクチャ(Active Target Search)を提案し、動的・混雑条件で堅牢化。 | RGB‑D+レーザ融合、Bayesian filtering、回帰で軌道予測、行動木で統合。実機(Toyota HSR)で実験。 | 能動探索は「視点(vantage)候補へ移動」+「再同定」の行動選択として設計(コスト関数の定式化必要性も議論)。 | 実機でリアルタイム追従・探索の成立を示す(ページ/図構成で統合を説明)。 | 長所:追従を“探索込み”で捉え直す。短所:設計自由度が高く、再現には多モジュール統合が必要。 |
| Algabri 2020(Sensors) | 屋内で遮蔽・照明変動に耐える追従を、深層検出+色特徴+状態機械で統合し、LiDAR SLAMで障害物回避まで含める。 | SSDで検出・追跡、HSVヒストグラムでターゲット同定、LiDAR SLAMで安全ナビ。 | “state-machine control” により追従状態遷移を設計(見失い→探索など)。制御は速度指令生成として実装。 | 11実験(総フレーム約15,562、総距離287.9m、総時間673.6s)で、10回は回復成功、1回は回復失敗(角で消失等)。照明変動で誤追従の限界も記述。 | 長所:実環境に近いプロトコルで反復評価。短所:色特徴は照明に弱く、誤同定リスクを残す。 |
| Do 2015(MVA) | 組込みデバイス前提で、RGB‑D+CamShift改良(HDOI)で追跡精度を上げ、仮想ばねで滑らかな追従を実装。 | RGB‑D、HDOI+CamShift。追従は safe/active region を持つ virtual spring model。 | 仮想ばねモデル(領域設計)で速度を生成(実装容易性を重視)。 | CamShift単体より精度改善・実装容易性を主張(短報形式)。 | 長所:軽量実装の方向性。短所:評価規模は限定的、混雑・遮蔽の体系評価は今後。 |
| Ye 2022(arXiv) | 単眼追従で問題となる “近距離で全身が写らない” を、幅ベース距離推定+頑健 Re‑ID(オンライン学習)で解決。 | Bounding box 幾何から processed measurement (y_k) を構成し、GNN+KFで多人追跡。Re‑IDはグローバル特徴+ridge regression(短期+長期サンプル)。 | 追従制御:ロボット座標系で (x) を所望値に維持し (y\to 0) を PID で実現、という構造を明示。 | 公開データセットで比較し、幅ベース追跡の有効性(近距離での失敗回避)を例示。 | 長所:近距離問題を設計レベルで解く。短所:事前キャリブレーション・検出器品質に依存。 |
| Ye 2023(ICRA採択) | 単眼追従の“部分遮蔽”を主題化し、可視関節から人物位置を推定する枠組みを提案。 | YOLOXでBBOX、AlphaPoseで関節。観測 (D={B,P})、(P) を可視関節集合として扱う。 | 複数関節から “人物位置推定への寄与” を統合する設計(関節高さ prior を構築し、追従は robot frame の推定位置に基づく)。 | 公開データセットで既存手法より “部分遮蔽下でも位置推定が安定” を報告し、実機でもデモ。 | 長所:遮蔽を前提化して定式化。短所:関節推定器の失敗(遮蔽+動き)に依存、計算量も課題。 |
| Rollo 2023(FollowMe / ARSO) | 視覚 Re‑ID+ジェスチャ+深度位置化+ROSナビ統合で、作業環境の robust person following をフレームワークとして提示。 | YOLACT++(instance segmentation)+Re‑ID(深層特徴、距離閾値)+深度で3D重心→KF平滑化→地図座標へ変換。 | Re‑ID距離:特徴分布(平均・分散)への標準化距離(式(1))。位置:カメラ座標→map座標変換 (p^m=T^m_c p^c)(式(2))。追従は nav stack が目標を追う。 | Re‑ID/ジェスチャは定量評価、全体フレームワークは動的障害物を含む実験で定性的検証(COCO事前学習も記述)。 | 長所:実装志向で“統合”が明確、デバイス不要の個人化。短所:RGB‑D前提になりやすく屋外適用は工夫が必要。 |
| 日本語:レーザレンジセンサを用いた人追従システムの開発(Life Support) | LRセンサで下腿検出・追跡し、障害物回避機能も含めた追従システムを試作。 | 下腿検出(障害物形状が類似すると誤認識)、障害物回避あり。 | 制御式の詳細は短報では限定的(追従機能の成立を主眼)。 | 約26mコース、被験者3名・計10回で7回成功。失敗は障害物の下腿誤認識が主因。 | 長所:国内短報として“成功率”を明示。短所:識別・混雑耐性の拡張が課題。 |
実装例と推奨構成
ROS 実装の現実解
研究〜実装の移行では、**追跡(people tracking)とナビ(障害物回避+動的追従)**の接続が要点になる。
2D LiDAR 脚追跡では、ROS の leg_detector が LaserScan から脚らしさを学習器で判定して追跡するパッケージとして公開されている。
マルチモーダル人物追跡では、SPENCER の spencer_people_tracking が “モバイルロボット向けの多人・グループ検出追跡フレームワーク” として GitHub で提供されている。
追従ナビ側は、Nav2(ROS2 の Navigation)が、動的目标(dynamic point)を追う行動木(Follow Dynamic Point)や、Following Server(Dynamic Object Following)を文書化しており、「(外部で推定した)人の pose をトピックに出す」→「ナビが追従」の分離がしやすい。
加えて、単眼での特定人物追従(検出・追跡・識別)を ROS パッケージとして提供する実装もあり、研究プロトタイプの再利用性を高めている。
センサ別・制御別の比較表
**センサ別(視覚単独/LiDAR単独/融合)**の実務的比較:
| 区分 | 代表例(文献) | 強み | 弱み | 推奨シーン |
|---|---|---|---|---|
| 視覚単独(単眼) | Koide 2020、Ye 2022/2023 | 低コスト・屋外適用余地、Re‑ID に有利 | 距離推定が難しい/遮蔽で破綻、計算負荷 | 価格制約が強いサービス、個人化重視 |
| RGB‑D中心 | Cosgun 2013、FollowMe 2023、Do 2015 | 深度で距離推定が安定、セグメンテーションで背景除去 | 屋外(赤外深度)制約、センサ重量・消費電力 | 屋内・作業場・テレプレゼンス |
| 2D LiDAR中心 | Cai 2014、Leigh 2015、日本語LR短報 | 照明に強い、軽量・高速、追跡ベンチが整う | “誰か”は追えるが“誰を”が弱い(Re‑ID不利) | 屋内AMR、工場・病院、低計算環境 |
| 融合(LiDAR+視覚等) | Kim 2018、Cosgun 2013、FollowMe 2023 | 混雑・遮蔽に強い、再捕捉戦略を組みやすい | 統合コスト・キャリブレーション負担 | 混雑空間、実運用(誤追従が致命的) |
制御/計画別の比較(“追従”に効く観点):
| 区分 | 代表例(文献) | 何が得意か | 注意点 |
|---|---|---|---|
| PID/PD(幾何誤差) | Cai 2014、Leigh 2015、Ye 2022 | 実装容易、チューニングで安定追従しやすい | ノイズで振動→デッドバンド等が必要 |
| 仮想ばね(相対運動吸収) | Morioka 2004、Do 2015 | 滑らかさ、急変の吸収、並走などの形状制御 | パラメータ設計が難しい/安全保証の形式化が課題 |
| DWA拡張・効用最大化(近未来) | Cosgun 2013 | 障害物回避と相対配置(社会性)を同時に最適化 | 重み設計が支配的、計算量管理が必要 |
| ランダム化 kinodynamic planning | Miura 2010 | 動的障害物+地図で安全・効率を両立 | 乱択性、最悪時の不安定挙動に注意 |
| MPC(予測追従) | Khawaja 2021 | 予測で遅れを抑え、終端・ステージコストで目的を明確化 | モデル化/制約設定が重い、計算資源が必要 |
実装に移す際の推奨構成(センサ/アルゴリズム/ROS/評価プロトコル)
-
センサ構成(推奨)
- 屋内・安全最優先:2D LiDAR(脚追跡)+(可能なら)RGB/RGB‑D(Re‑ID補助)を第一候補。2D LiDAR の追跡評価と追従統合は benchmark・指標が揃っている。
- 低コスト・単眼縛り:単眼+(i)幅/骨格を使った距離推定 prior、(ii)KF/UKF、(iii)オンライン Re‑ID(外観特徴+オンライン学習)を “最初からセット” で入れる。
- 混雑・遮蔽が前提:関節点を観測として利用し、部分遮蔽でも位置推定が崩れにくい設計(joint set (P) を明示)+再捕捉戦略(能動探索や state machine)を組み込む。
-
アルゴリズム(推奨)
- 追跡:KF/UKF+GNN などの関連付け(多人・混雑を意識)。LiDAR 系は ID switch を主要 KPI に置く。
- Re‑ID:オンライン学習(外観特徴の適応)+「誤 Re‑ID に対して追従を即切替しない」ガード(しきい値・連続フレーム条件)を入れる。
- 制御:まず PID/PD(距離+方位)+デッドバンド/速度制限対応で確実に動かし、その後、必要に応じて DWA拡張や MPC に上げる(要件が “社会的配置” や “予測追従” を含むとき)。
-
ROS パッケージ(推奨)
- LiDAR脚追跡:leg_detector(ROS)を起点に、必要なら SPENCER へ(多人・マルチモーダル)。
- ナビ:Nav2 の Follow Dynamic Point / Following Server で「人の推定位置(Pose)」を追従目標として扱う分離を推奨。
- 単眼 Re‑ID 追従:公開実装(monocular_person_following)を参照し、センサ・計算資源制約下の設計パターンを流用。
-
評価プロトコル(最低限)
- 追跡:MOTA/MOTP、ID switch、miss を報告(特定人物では ID switch を最重視)。
- 追従:平均追従距離、距離時系列(見失い→再捕捉を含む)、衝突回数、追従成功率(複数試行)を報告。
- 条件:屋内/屋外、近距離(被写体はみ出し)、遮蔽(部分遮蔽・完全遮蔽)、照明変動、混雑(他者横切り)を最低1つずつ含める。





