了解しました。地図なしナビゲーション(mapless navigation)に関する最新の研究動向を調査します。視覚情報や距離センサに基づく学習手法、ランドマークベースナビゲーション、自己教師あり強化学習なども含めて検討し、近年の論文・アプローチ・応用事例などをまとめてお伝えします。

地図不要の自律移動ロボットナビゲーション: 最新研究動向

はじめに

自律移動ロボットのナビゲーションにおいて、事前に作成した地図に依存せずに目的地へ到達する「マップレス(地図不要)ナビゲーション」が注目を集めています。従来はGPSや高精度な環境地図に基づく経路計画が一般的でしたが、未知環境や動的環境では地図作成や維持が困難であり、地図に頼らない適応的な手法が求められています。本稿では、特に2022年以降の最新研究を中心に、カメラや距離センサのみを用いたナビゲーション手法深層強化学習による戦略教師なし・自己教師あり学習ランドマークに基づくトポロジカルナビゲーション小型ロボットへの実装屋内外での適用事例と評価指標について概観します。それぞれのアプローチの比較については表1にまとめます。

視覚・距離センサのみを用いたマップレスナビゲーション

地図情報を用いずオンボードセンサの情報だけで走行する手法として、カメラ映像やLiDARなど距離センサから得られる情報を直接利用するアプローチがあります。これらはロボットが取得するセンサデータを即座に解釈して障害物を回避しつつ移動するもので、古典的には壁沿い走行やバグアルゴリズム、動的ウィンドウアプローチといった手法が知られていますが、近年は学習や視覚認識を組み合わせて高度化が図られています。

カメラ映像を用いた視覚ナビゲーション

カメラのみを用いる場合、画像処理や機械学習によって環境から進行可能な空間や目標への方角を判断します。特に視覚的ナビゲーションでは、ロボット搭載カメラから得た画像を用いて自己位置の推定や経路判断を行います。一例として視覚的場所認識(Visual Place Recognition, VPR)があります。VPRは現在のカメラ画像と事前に記憶した画像データベースを照合し、ロボットが「以前訪れた場所」を識別する技術です。これにより地図を持たなくとも環境中のランドマークを手掛かりに自己位置推定や目標場所の再認識が可能となり、トポロジカルな経路計画に活用できます。しかし、画像の高次元特徴量を扱うため計算コストが大きく、VPR処理の効率化は現在も活発な研究課題です。近年の研究では、画像中の物体やテキスト情報を用いた手法やディープラーニングによるエンコーディング手法が提案され、異なる環境や照明条件への頑健性向上が図られています。また、地図を使わずカメラで取得したシーンそのものを記憶・再現する手法も研究されています。例えば2024年に報告された昆虫に着想を得た経路追従では、ロボットの往路で取得したパノラマ画像を圧縮保存し、その空間的な繋がり(オドメトリ情報)と併せて記憶します。復路では自己位置に最も近い記憶画像をカメラ映像と比較する視覚ホーミングによって次の目標地点を定め、蓄えたランドマーク系列を順にたどることで出発地点まで戻ります。この手法は56gという極小ドローンで実証され、100メートルの経路を1メートルあたり20バイト以下のデータ量で記憶し走破できることが示されました。カメラのみを用いる利点は、安価で軽量なセンサ1つで環境のリッチな情報を得られる点や、物体・文字認識など高次タスクへの応用が効く点です。一方で課題として、画像処理には高い計算リソースが必要であること、照明や視点の変化に弱い可能性、センサノイズやブレの影響を受けやすいことが挙げられます。上記のドローンのように計算量を削減する工夫(画像圧縮や必要最小限の記憶)や、VPR精度を監視して誤認識時に再計画する手法によって、視覚ナビゲーションの信頼性向上が進められています。

距離センサを用いたナビゲーション

LiDARや超音波センサといった距離センサのみを使う手法も地図不要ナビゲーションでは一般的です。距離センサは周囲の物体までの距離情報を直接取得でき、環境の幾何的な把握に優れます。典型的には取得した距離スキャンから障害物の方向を検知し衝突回避を行うリアクティブ(反応型)な手法が取られます。近年ではこれに強化学習を組み合わせた例が多くみられます。例えばSlavovaら(2025)は2D-LiDARのセンサ読み取り値のみを入力とし、地図や事前経路を用いないナビゲーション手法を提案しています。LiDARセンサの生データを9分割して最短距離だけを抽出する低次元入力を設計し、強化学習エージェント(PPOアルゴリズム)により障害物を避けつつゴール最短到達を学習させています。地図を持たずLiDARだけに頼る本手法は、動的に変化する環境下でも即応的に判断を下せるためロボットの意思決定を高速化し、コスト削減や適応性向上につながると報告されています。距離センサベースの利点は、環境の幾何情報を直接扱うため障害物回避や衝突検知を比較的信頼性高く行えること、光に影響されず昼夜問わず動作できることです。特に室内ではLiDARによる自己位置推定や衝突回避の精度が高く、多くの移動ロボットで採用されています。一方、課題はセンサが検知できない細物体やガラスなどへの対処、センサ範囲外の情報は得られないためグローバルな経路最適化が難しい点です。また単一の距離センサだけではゴール方向の手がかりがなく、最適経路を見出すには工夫が必要です。このため、あらかじめゴール方向の方角を与える(ロボットにゴールまでの相対座標だけ教える)設定や、距離センサに加えて方位センサ・コンパスなどを併用することもあります。近年の研究では距離センサ+強化学習によって地図レスでゴール誘導を実現する例が多く、報酬関数を工夫して最短経路に誘導したり、センサから得られる部分的な環境情報のみで安全かつスムーズに進む方策を学習できることが示されています。総じて、オンボードカメラあるいは距離センサのみを用いたナビゲーションは、追加のインフラや事前マッピングを要さずセンサデータに基づく自律性を実現するアプローチです。その反面、ローカルな情報に頼るため行き詰まり(デッドロック)状態への対処や、ゴールまでの大域的な最適経路を保証できないといった課題も残されています。その克服のため、次節で述べる機械学習や強化学習を組み合わせた高度化が進められています。

強化学習を用いたナビゲーション戦略

地図不要ナビゲーション分野では、ロボットが試行錯誤を通じて最適な行動方策を学習する強化学習(RL)の導入が近年大きく進んでいます。深層強化学習(Deep RL, DRL)によりカメラ画像やLiDARスキャンなど高次元の生センサ入力から直接ロボットの操作量を出力させるエンドツーエンド学習が可能となり、地図構築や経路計画モジュールを明示的に用いないナビゲーションが実現されつつあります。ここでは通常の教師あり設定の強化学習と、報酬や教師信号を用いない自己教師あり(教師なし)学習によるナビゲーション戦略について述べます。

深層強化学習によるマップレスナビゲーション

深層強化学習では、ニューラルネットワークがセンサ観測を受け取り、ロボットの次の行動(速度や舵角など)を出力します。エージェントは環境との相互作用を繰り返す中で、与えられた報酬関数に沿って高い報酬が得られるような行動パターンを学習していきます。この方法は地図や経路プランナを内蔵せずともエンドツーエンドで障害物回避や目標到達を実現できる点が革新的です。初期の研究では、高次元な画像入力に対してDeep Q Network (DQN)を適用しロボットの離散的な操作制御を学習する試みや、連続値の速度制御にDeep Deterministic Policy Gradient (DDPG)アルゴリズムを用いる例がありました。また、畳み込みニューラルネットワーク(CNN)で画像から環境特徴を抽出しRLで方策決定するモデルフリー型の手法では、障害物を回避しつつゴールを目指すことに成功した一方、高解像度画像入力は計算資源を大量に消費するため小型ロボットでは現実的でないことが指摘されています。そのため、入力次元を減らす工夫(例えばLiDARの要約データ利用や画像からセマンティックな要点だけ抽出するなど)が重要になります。また、単純なモデルフリー強化学習は探索効率が悪い場合があり、ゴールまでの距離や方角をネットワークに与えて目標指向型に拡張したActor-Critic手法も提案されました。Zhuら(2017)のTarget-driven Navigationは、画像で与えられた目標に向かうポリシーを学習するもので、ゴール画像特徴と現在観測をネットワークに入力し、未知の室内環境でも目標物体へ到達できることを示しました。このような目標条件付きポリシーの導入は、ゴールが変化しても再学習不要な汎用ナビゲーションに繋がる重要なステップでした。一方で、深層強化学習アプローチ全般に共通する課題として、シミュレータでの長時間学習や膨大な試行が必要な点、学習したポリシーの汎用性や安全性の担保が挙げられます。シミュレーションと実機のギャップを埋める研究(Sim-to-Real)や、報酬関数に障害物との距離ペナルティや速度制限を組み込んで安全性を向上させる工夫、模倣学習と組み合わせて専門家データから効率よく学習する手法なども検討されています。最近では階層型強化学習によりサブゴールへの分割統治で探索効率を上げる試みや、分布型RLで学習の安定性と性能向上を図る研究も報告されています。これらDeep RLベースの手法により、地図が無くともセンサ観測→行動という直接マッピングが可能となり、特に動的な障害物回避や人混み中の走行など、従来のモデルベース手法では難しかったシナリオで有望な結果を示しています。

教師なし・自己教師あり強化学習によるナビゲーション

近年注目されるのが、明示的な外部報酬や人手による教師信号を用いずにロボットが自律的にナビゲーション能力を習得するアプローチです。自己教師あり強化学習とは、エージェント自身で定義した目的(内部報酬)に基づいて方策を学習する手法で、報酬設計を不要にしエージェントの自律性を高める狙いがあります。Polykretisら(2024)は脳の海馬のような認知地図の考え方を取り入れ、浅いニューラルネットワークと局所学習則による自己教師ありナビゲーション手法を提案しました。この手法では従来の深層Qネットワーク(DQN)に匹敵するゴール到達精度と経路効率を達成しつつ、パラメータ数・計算量を大幅に削減しています。特筆すべき点として、新奇性駆動の探索(Novelty-based exploration)とランダム歩行を組み合わせることでタスク固有の報酬設計を省き、エージェント自ら環境を多様に探査できるようにしています。ネットワーク構造もきわめて浅く局所的な重み更新則を採用しており、誤差逆伝播を用いない学習でも高い性能を示しました。これによりメモリ使用量が削減され、ニューラルネット用の勾配計算回路を持たないニューモーフィック・プロセッサ(脳型計算ハード)上での実装も容易になります。実際、本手法は従来型のDQNと比べ同等のゴール到達率・経路長で動作しつつ、学習に要するリソースを大幅削減できることが示されています。この他にも内発的動機付け(intrinsic motivation)を用いた探索戦略が盛んです。エージェントの予測誤差や情報利得を内部報酬とし、地図のない環境で未知領域を積極的に開拓する研究、ゴール方向ではなくエージェントの好奇心を原動力に環境を隅々まで探索させることで結果的にナビゲーション能力を向上させる手法などが提案されています。自己教師ありの利点は、人手による細かな報酬設計や大量のラベル付けデータを必要とせず、ロボット自身が経験から学べる点にあります。特に事前知識のない未知環境では有効な戦略となりえます。しかし課題もあり、外部目的がない分エージェントの行動が発散しやすく学習に時間がかかる可能性があります。また得られたポリシーがユーザの意図するタスク(例:特定の場所への到達)とずれてしまうこともあるため、適度に外部から目標を与える仕組みとのハイブリッドが模索されています。総じて、自己教師ありを含む強化学習戦略は地図不要ナビゲーションの柔軟性を飛躍的に高めており、シミュレーションのみならず実ロボットへの適用も徐々に報告されています。

トポロジカルナビゲーション(ランドマーク巡回)

トポロジカルナビゲーションとは、環境中のランドマーク(特徴的な地点)をノードとするグラフ(トポロジカルマップ)を構築し、そのグラフ上で経路探索を行う手法です。従来のメトリックマップ(幾何学的な地図)とは異なり、トポロジカルマップは各ランドマーク間の接続関係に着目した簡易かつ抽象化された地図といえます。例えば建物内で「部屋Aの入口」「廊下の角」「部屋Bの入口」といった地点をノードとし、「入口から角を経て別の入口へ行ける」といった繋がりをエッジで表現します。ロボットは現在いるノードを視覚やセンサで認識し、目的ノードまでグラフ上の経路に沿って移動します。トポロジカル手法の利点は、地図構築やメモリ消費が比較的軽量で済む点、多少の環境変化にもロバスト(多少位置がずれてもノード認識でカバー)である点、そしてグラフゆえに人間にとっても経路が解釈しやすい点です。また大規模環境でも、細部まで精密に測量した地図を保持する必要がないためスケーラビリティに優れます。事実、動物や人は頭の中で概略的な空間のつながり(トポロジー)を記憶してナビゲーションしているとも言われ、これを模倣した生物模倣学習の観点からも研究が進んでいます。

トポロジカルナビゲーションを実現するには、まずランドマーク候補の検出と記憶が必要です。視覚情報から特徴的な場所を検出する場合、前述のVPR技術が鍵となります。最近の研究ではディープラーニングで環境画像を埋め込みベクトルに変換し、類似度の高い画像を同一ノードとみなすループクローズ検出手法が発展しています。Kimら(2023)はトップロジカルセマンティックグラフメモリ(TSGM)というフレームワークを提案し、RGB-Dカメラで得たシーン画像から逐次ランドマークグラフを構築しつつ、与えられた目標画像と一致する場所を探索するナビゲーションを実現しました。グラフノードにはシーンのセマンティクス(「ドア付近」「本棚前」など)が付与され、ノード間はロボットの移動履歴に基づく辺で繋がれます。TSGMは未知環境における画像目標ナビゲーション課題で従来手法を大きく上回る性能を示し、成功率で+5〜9%、経路効率(SPL)で+7〜23%の改善を達成しました。さらに実ロボット(移動ロボット平台)で目標画像の物体を探し当てる実証も行われています。このように、トポロジカル手法はセマンティックな記憶と結び付けて高レベルのナビゲーション(例:指定された部屋に行く、特定の物体を探す)に応用され始めています。

一方、トポロジカルナビゲーションの課題としては、ランドマーク選択の難しさと環境の曖昧さへの対処が挙げられます。類似した見た目の場所が複数ある場合、誤ってノードを取り違える恐れがあります。このためセンサ情報はカメラに加え距離センサや磁気センサなど複数モダリティ融合で認識精度を上げる工夫があります。またトポロジカルマップは抽象度が高い分、細かな障害物回避はローカルに任せる必要があり、グローバルプランとローカルリアクティブ制御のハイブリッド構成が一般的です。最近の研究例として、Hossainら(2024)のTopoNav動的にトポロジカルマップを構築しながら階層型の強化学習で探索とナビゲーションを行うフレームワークです。TopoNavでは高レベルで「次に訪れるべきノード」を決め、低レベル制御で障害物回避を行いながらそのノードへ向かいます。環境探索時には新規エリアを優先する内発的報酬を与え、報酬の乏しい環境でもグラフを効率良く拡大できるよう設計されています。シミュレーション実験では、TopoNavは従来の平坦な強化学習手法に比べ探索面積の拡大率やゴール到達精度で優位を示し、障害物の多い環境でも高い適応性を確認しています。さらにこの考え方は地上だけでなく、水中ドローンが水中構造物内部を地図なしで巡回する応用や、複数ロボットが協調してランドマークマップを分散構築するシナリオにも広がっています。トポロジカルナビゲーションは、地図を簡略化しつつ要所を押さえた効率的な経路計画を可能にするアプローチとして、今後ますます重要になると考えられます。

小型ロボット・省電力デバイスへの実装例

マップレスナビゲーション技術を現実のロボットに展開する際、計算資源や電力の制約は避けて通れません。特に小型ロボットやドローン、組み込みデバイス上で高度なナビゲーションを実現するには、アルゴリズムの軽量化・高速化が鍵となります。近年、リソース制約下で動作可能な省電力ナビゲーション手法の研究も進展しています。

一つの方向性は、ニューラルネットワークに代わる軽量な計算パラダイムの活用です。Stanford大学の研究チームは高次元コンピューティング(Hyperdimensional Computing, HDC)に基づく手法「NavHD」を提案し、マイクロロボット上での自律航法に取り組みました。NavHDでは8個の超音波センサから得た距離データをハイパーベクトルと呼ばれる高次元ベクトルにエンコードし、軽量なXORやビットシフト演算で障害物回避の判断を行います。ARM Cortex-M4といった小型マイクロコントローラ上で実装されたNavHDモデルは**メモリ使用量わずか10.2KB、推論あたり900クロック(1.1mJ)**という極めて小さい計算コストで動作し、シミュレーションおよび実機実験で従来のDNNベース手法を上回る障害物回避性能(成功率2倍以上)を示しました。リソース効率も大幅に改善(エネルギー/メモリ効率で2〜26倍)しており、超小型ロボット群での協調探索などへの応用が期待されています。

他のアプローチとして、センサやアルゴリズム自体を省資源向けに設計する例があります。前述の昆虫模倣型の研究では、最小限必要なパノラマ画像のみ圧縮記憶することで56gドローンにナビゲーション機能を持たせました。また、専用ハードウェアの活用も進んでおり、イベントベースカメラ(動きのある画素のみ記録するカメラ)と組み合わせて低データ量で衝突回避を行う手法や、FPGA・ASIC上に軽量ナビゲーション回路を実装する試みもあります。ニューロモルフィックプロセッサ(SpiNNakerやLoihiなど)上で動作するナビゲーションアルゴリズムも研究されており、前述の自己教師あり学習のように誤差逆伝播を用いない局所学習則を適用することで、スパイクニューラルネットによる超低消費電力ナビゲーションも視野に入っています。

小型ロボットへの実装例としては、数cm程度の超小型車両ロボットによる迷路走破や、手のひらサイズドローンによる部屋内巡回などが報告されています。これらでは、市販の安価なマイコン(数十MHz駆動)上でセンサ融合や簡易な学習アルゴリズムを組み込み、リアルタイムに障害物回避が可能であることが示されています。一方で、小型ロボットは計算能力だけでなく搭載できるセンサにも制約があります。LiDARなどは大きすぎたり電力を消費しすぎたりするため、カメラや赤外線レンジファインダ、超音波といった軽量センサを組み合わせる工夫がされています。今後、こうした省電力ナビゲーション技術の発展により、極小ロボット群による探索やウェアラブル機器としてのロボット案内など、新たな応用領域が開けると期待されます。

屋内・屋外での適用事例と評価指標

適用事例(ユースケース)として、地図不要ナビゲーションは様々な環境で試みられています。屋内環境では、家庭内でのサービスロボットが地図なしで人や障害物を避けながら目的地に移動するケースや、倉庫内ロボットが動的な棚配置に対応して走行するケースがあります。研究実験では、オフィスや住宅環境を模したシミュレータ(HabitatやGibsonなど)上で、ゴール指向のナビゲーションタスク(例:「指定された部屋に行く」「特定のオブジェクトを見つける」)が盛んに評価されています。一方、屋外環境では、都市部におけるGPSが使えないエリアでの移動ロボット(GPS遮断下での巡回監視ロボット)、不整地を走行する無人地上車(UGV)の障害物回避、災害現場での捜索ロボットや、森林・農地における小型ドローンの自律飛行などが想定されています。例えば、災害救助ロボットでは事前の詳細地図が存在しない倒壊建物内を探索する必要があるため、マップレス技術の自律性が真価を発揮します。また火星探査ローバーなど惑星探査や、水中ドローンによる深海・水中洞窟探査といった極限環境でも、地図を逐次構築することが困難なためマップレス・ナビゲーションの重要性が指摘されています。屋外では環境が広大で地形の変化も激しいため、ロボット自身が限られた手がかり(カメラ映像や距離情報)からオンラインで環境理解と経路判断を行う必要があります。この際に評価されるのがロボットの適応性頑健性です。例えば、未知の障害物が出現した際に即座に経路を変更できるか、路面の凹凸や傾斜といった走行困難な地形にも対応できるか、といった点が実証実験で検証されています。

評価指標としては、ナビゲーションタスクの達成度や効率を定量化するため以下のような指標が用いられます。

  • 成功率(Success Rate): 与えられたゴールにロボットが到達できた割合を示します。複数回の試行で何回ゴールできたか(%)で表し、ナビゲーション手法の信頼性指標となります。動的環境では時間内に到達できたかどうか、探索タスクでは目標物を発見できたかどうかで定義する場合もあります。
  • 経路効率(Path Efficiency): 実際に走行した経路の長さが、理想的な最短経路と比べてどの程度余分かを示す指標です。一般に 経路効率 = 最短距離 / 実走行距離 で定義され、1.0が最も効率的(最短経路通り)となります。類似指標として**SPL (Success weighted by Path Length)**が広く用いられ、成功した経路の長さが最短の何倍かを平均した値として算出されます。SPLは成功率と経路効率を統合した指標で、例えば成功しても遠回りばかりではスコアが低下します。
  • 衝突回数・安全性: ナビゲーション中に障害物と接触した回数や、緊急停止の回数などで安全性を評価します。特に人混みや動的障害物がある環境では、無衝突率やヒヤリハット発生頻度なども重要な指標です。
  • 到達時間(所要時間): ゴールに辿り着くまでの時間やステップ数も評価されます。時間効率は移動ロボットの実用性に直結するため、多くの研究で成功率とともに報告されています。
  • 探索面積・情報収集量: 地図を逐次構築する場合にはカバレッジ率(Coverage)として、ある時間内にどれだけのエリアを探索できたか(探索済み領域面積 / 全体領域面積)を測定することがあります。同様に、ロボットが獲得した環境情報量(地図のエントロピー減少量など)を情報ゲインとして定義する例もあります。これは探索タスクや環境マッピング性能を見る指標です。

評価はシミュレーション上でのベンチマークテストや、実ロボットを用いた試走実験によって行われます。近年ではFacebook (Meta)社のHabitatシミュレータを用いた競技会が開催されており、画像目標ナビゲーション(ImageNav)や物体目標ナビゲーション(ObjectNav)のタスクについて各種手法の成功率・SPLが競われています。このようなベンチマークにより、公平な条件での手法比較と技術進歩の可視化が進んでいます。

最後に、マップレスナビゲーション手法の特徴をまとめた比較表を以下に示します(表1)。各アプローチの使用センサ、学習の有無、利点・欠点、および代表的な研究例を一覧しています。

表1: 地図不要ナビゲーションのアプローチ比較

アプローチ 主な使用センサ 手法の特徴・原理 利点 課題・制限 代表的な研究例・プロジェクト
視覚ベースナビゲーション(カメラ使用) カメラ映像(RGB、RGB-D) 画像から環境特徴を抽出し、障害物回避や自己位置推定を行う。VPRにより既知場所を認識してトップロジー的に巡回(視覚ホーミング等)。学習なしの画像処理アルゴリズムやCNNを用いたエンドツーエンド手法まで幅広い。 安価なカメラ1つで周囲の豊富な情報を取得可能。物体・シーン認識と統合し高レベル指示にも対応しやすい。 ライティングや視点変化に弱い。画像処理の計算負荷大でリアルタイム実装が難しい。テクスチャの乏しい環境では自己位置特定が困難。 昆虫模倣のルートメモリ法(56gドローン), Visual Place Recognitionによる再局所化(QUT, 2024)
距離センサベースナビ(LiDAR等) 2D/3D-LiDAR、超音波 センサで測距した周囲障害物との距離情報をもとにリアクティブに回避行動。局所マップ(グリッドなど)を逐次構築し衝突のない方向へ進行。学習なしでは壁追従やバグアルゴリズム、学習ありではLiDARスキャンを入力に深層RLが動作。 距離情報は環境幾何を直接反映するため障害物回避精度が高い。暗所や煙霧下でも動作可能。センサノイズが比較的小さく制御安定。 局所的な障害物回避のみでは行き詰まり状態に陥る恐れ(大域的プラン不在)。高価なセンサが多く小型ロボットには搭載困難。ガラスや細柱など一部検知困難な障害物も。 LiDARのみでPPO強化学習(ROS Flatland環境), 超音波センサアレイ+HDC学習(Stanford NavHD)
深層強化学習(DRL)(教師あり) カメラ、LiDAR、複合センサ センサ観測をそのままニューラルネットに入力し、ロボット操作を出力。試行錯誤で最適行動方策を学習。価値ベース(DQN)やポリシーベース(PPO)など手法多様。ゴール情報を与えることで任意目標への到達も可能。 モデルに頼らず学習によって複雑な環境への適応が可能。動的障害物や不確実な状況でも報酬設計次第で対応可能。地図構築が不要でセンサ→行動の直接マッピングを実現。 学習に大量のデータと時間が必要。シミュレータと実環境の差異により実ロボットで性能劣化のリスク(Sim2Real問題)。報酬の設計如何で意図しない行動を学習する可能性。安全性の保証が難しい。 Target-Driven Navigation(CNN+RLで室内目標指向移動), TopoNav(階層型RLで探索効率向上)
自己教師ありナビ(教師なし強化学習) カメラ、LiDAR、イベントカメラ他 人手の報酬を用いず、エージェント内部の基準で学習。新奇性(予測誤差)に基づく内的報酬で未踏エリアを積極探索。あるいは事前に自己位置推定や表現学習を行い、方策学習を支援。浅いネットワークと局所学習則でメモリフットプリントを削減。 報酬設計を必要とせず自律的に学習可能。未知環境への汎用適応力が高い。ニューロモルフィックHW適応など超低消費電力動作も視野。 学習収束に時間がかかる場合がある。タスクの明確な目標がないと有用な方策に辿り着かない恐れ。従来手法とのハイブリッドでないと性能が劣るケースも。 Cognitive Map based Navigation(Accenture Labs; 報酬不要RL), ReactHD(LiDARでのHDC強化学習, Intel)
トポロジカルナビ(ランドマーク巡回) カメラ(画像特徴)、GPS(ノード位置)、LiDAR他 環境内の特徴地点をノード、通行経路をエッジとするグラフを構築しナビゲーション。ランドマーク認識にVPRやセンサフュージョンを用い現在ノードを特定、グラフ上で経路探索し次の中間地点へ移動。各移動区間では従来の障害物回避手法や局所PLANNERを使用するハイブリッド型。 地図データ量が小さくメモリ・計算効率良い。動的環境でもランドマークが生きていれば再適応可能。経路が人にも理解しやすく高レベル計画と相性◎。 類似ランドマークの誤認識に弱い。精密な位置制御はできず最短経路からの乖離もあり得る。ランドマーク未検出の空白エリアでは手詰まりになる可能性。環境の大きな変化でグラフ再構築が必要。 TSGM(画像目標ナビでSOTA, SNU)、TopoNav(探索とナビ統合、米Army研)、RatSLAM(QUT, 生物模倣的地図)

上記の比較から、地図不要ナビゲーションと言っても多様なアプローチが存在し、それぞれ異なるセンサやアルゴリズム上の工夫によって長所・短所が現れることが分かります。近年はこれらの組み合わせも活発で、例えば「LiDARによる障害物検知+カメラによるランドマーク認識+強化学習による方策決定」のように、複数手法を補完的に用いるハイブリッドなナビゲーションシステムも研究されています。

代表的な研究プロジェクト・研究機関

最後に、近年のマップレスナビゲーション分野で顕著な成果を挙げている代表的な論文・プロジェクト・研究機関を紹介します。

  • Stanford大学 NavHDプロジェクト – 超音波センサと高次元コンピューティングによるマイクロロボット自律航法。HDCを用いわずか10KBのメモリで動作するモデルを開発し、小型車両ロボットでの障害物回避成功率を2倍に向上。
  • Accenture Labs (米)自己教師ありの浅層ニューラルネット航法を提案。報酬不要の強化学習でDQN並みの性能を達成し、エッジデバイス・ニューロモーフィック実装を可能にした。
  • ソウル大学 (SNU) Songhwai Oh研究室Topological Semantic Graph Memory (TSGM) 手法を開発。画像入力でランドマークグラフを構築し画像目標ナビゲーションを実現、CoRL 2023で高い評価。
  • クイーンズランド工科大学 (QUT) Michael Milford教授ら – 長年VPR研究をリードし、近年もロボットナビへのVPR適用で成果。2024年にはVPRの信頼性モニタによりナビゲーション成功率を約41%→55%に改善する手法を発表。
  • デルフト工科大学 (TU Delft) Guido de Croon教授ら昆虫視覚に学んだ超小型ドローンのルートナビゲーションをScience Robotics 2024で発表。56gナノドローンにより往路の映像を記憶し復路で追従する実証に成功。
  • Meta AI (旧Facebook) – フォトリアルな3Dシミュレータ「Habitat」を公開し、ObjectNavやImageNavなど地図不要ナビゲーションの国際チャレンジを開催。多くの研究チームがHabitat上で手法を競い合い、本分野の進展を促進。
  • 米国Army研究所 & メリーランド大学Baltimore郡TopoNavプロジェクトで階層型強化学習と動的トポロジーマップを統合したフレームワークを開発。災害対応や探査ロボットへの応用を視野に、スパース報酬環境での効率的探索を実現。

これら以外にも、中国や欧州を中心に多くの大学・研究機関で地図レスナビゲーションの研究が活発に行われています。産業界でもTeslaやWaymoのような自動運転車におけるエンドツーエンド学習、Boston Dynamicsの四足歩行ロボットのカメラベース自己位置推定など、関連技術の実装が進んでいます。地図不要ナビゲーションは、未知の環境で即時にロボットを投入できる将来像につながる重要技術であり、今後も学術・産業双方で研究開発が加速していくでしょう。

 

地図なしナビのレビュー論文はありますか?

 

あります。直近3年中心に「地図なし(mapless / map-free)ナビ」に直結 or 近接領域を俯瞰する“レビュー/サーベイ(総説)”を用途別にまとめました。

総合サーベイ(maplessを章として含む)

  • A Comprehensive Review on Autonomous Navigation(ACM Computing Surveys, 2025)
    自律移動全体を俯瞰。センサ、計画、学習系、そしてmapless・visionベースの流れも整理。まずここを“索引”として使うのが効率的。 (ACM Digital Library)
  • A survey of autonomous robots and multi-robot navigation(AI in Mech. Systems, 2024)
    単体〜マルチロボの計画/制御を広く俯瞰。学習系の地図非依存戦略にも触れる総説。 (サイエンスダイレクト)
  • A survey of visual navigation: From geometry to embodied AI(Engineering Applications of AI, 2022)
    幾何学(地図あり)から**視覚のみのエンボディドAI(地図不要)**までの系統立て。視覚中心でmapless設計の位置づけが掴みやすい。 (ACM Digital Library)

学習ベース/RL中心のレビュー(maplessを主題または主要ケースとして扱う)

  • Advancements in Learning-Based Navigation Systems for Mobile Robots(Sensors, 2024)
    ビジョン中心の学習型ナビを横断レビュー。SLAM依存を減らすmapless/hybridの設計指針が整理されている。 (MDPI)
  • A Comprehensive Review of Mobile Robot Navigation in Crowded Environments with Deep RL(J. Intell. Robot. Syst., 2024)
    群衆中ナビのDRL総説。地図に頼らず局所観測→行動のエンドツーエンド方針が主題。 (スプリンガーリンク)

トポロジカル/ランドマーク系(maplessと相性が良い)

  • A Review of Topological Map Construction Methods for Indoor Robots(CEUR Workshop, 2024)
    軽量なトポロジカル表現の構築法を比較。Teach-&-RepeatやVPR併用の地図レス運用にも応用しやすい。 (ceur-ws.org)
  • A survey of Object Goal Navigation(ObjectNav)(IEEE TASE, 2024)
    物体を“目標”として未知環境へ到達するナビを俯瞰。実質的に地図なし前提の研究が多く、手法比較に有用。 (orca.cardiff.ac.uk)

視覚的場所認識(VPR)レビュー(maplessの再局所化に直結)

  • General Place Recognition Survey: Towards Real-World SLAM 2.0(arXiv, 2024)
    画像/点群の場所認識を広く整理。地図なしの再訪・再局所化にそのまま効く。 (arXiv)
  • SVS-VPR: A lightweight VPR review(Sensors, 2024)
    手作り特徴/深層特徴/セマンティクスの3系統でVPRを批判的レビュー。軽量化の観点が役立つ。 (MDPI)
  • (古典だが基礎)Visual Place Recognition: A Survey(IEEE TRO, 2016)
    VPRの概念整理に今も有用。 (ACM Digital Library)

ドメイン特化の近接レビュー(GPS不感/空撮など:mapless実装の知見に有用)

  • UAV autonomous navigation in GPS-denied environments: a review(Robotics and Autonomous Systems, 2023)
    GNSSなしの自己位置推定・回避の設計を体系化。地図前提でない運用制約の理解に最適。 (サイエンスダイレクト)
  • Visual Place Recognition for Aerial Imagery: A Survey(RAS 2025 / arXiv 2024)
    空撮VPRの総説。照明/季節/視点変化へのロバスト化が地上maplessにも転用可。 (サイエンスダイレクト, arXiv)

歴史的だが“mapless特化”の古典総説

  • Autonomous Vehicle Navigation Using Vision and Mapless Strategies: A Survey(Journal of Robotics, 2013)
    視覚×地図なしにフォーカスした希少な古典サーベイ。現代手法の前史を掴むのに便利。 (SAGE Journals)

使い方のヒント(読み順)

  1. まず CSUR 2025EA-AI 2022 で全体像→
  2. 学習系は Sensors 2024(学習ナビ総説)DRL群衆ナビ総説
  3. 実装寄りなら トポロジカルレビューVPRレビュー をセットで。
    屋内でScout系に適用するなら、VPRレビューの軽量化・ロバスト化節は特に有用です。 (ACM Digital Library, MDPI, ceur-ws.org)

「この論文だけPDFで読みたい」「maplessの中でも○○(例:LiDAR無し、教示巡回、自己教師あり)に絞ってさらに掘りたい」などあれば、該当節と代表実装をもう少し狭くピックアップします。

 

ロボットの競技会はどのようなものが開催されていますか

 

いい質問です。ロボット競技会は「目的×フィールド」で系統が分かれます。地上自律移動/社会実装・防災/レース系/海・空(マルチドメイン)/教育向けの代表例を要点だけ。

地上の自律移動(屋外・実環境)

  • つくばチャレンジ(日本):つくば市の歩行者環境で、1km超の自律走行を公開実験形式で実施。2007年から毎年継続。実環境での経路維持・回避の総合力が問われます。(J-STAGE)
  • IGVC(米・Intelligent Ground Vehicle Competition):学生チームの自律地上車大会。ライン追従、障害回避、自己位置推定などを総合評価。毎年米国で開催。(RoboNation, igvc.org)

社会実装/防災・インフラ(日本発)

研究コミュニティ直結(複数リーグ)

  • RoboCup:サッカー(Humanoid/Standard/Small Size)、@Home(家庭内サービス)Rescueなど研究課題ごとにリーグが分かれます。年度ごとのルールとベンチマークで継続評価。(robocup.org, athome.robocup.org)

自動運転レース系(移動体知能を競う)

海・空(マルチドメイン)

  • RoboSub(AUV)/RoboBoat(ASV)/Maritime RobotX:水中・水上の完全自律タスク(物体検出・操船・協調)。学生〜大学院主体、年次ごとに課題更新。(RoboNation, RobotX)
  • IARC(International Aerial Robotics Competition)/IMAV:屋内外の自律ドローン高難度課題やMAV競技+学会併設。(aerialroboticscompetition.org, IMAVS.ORG)

教育・一般(日本中心)

  • NHK学生ロボコン/高専ロボコン:毎年テーマが変わる設計・制御総合競技(自律・遠隔混在)。国内最大級。(official-robocon.com)
  • 全日本マイクロマウス大会:自作小型ロボで迷路最短走行を競う老舗大会(トレース部門等あり)。(ntf.or.jp)
  • WRO(World Robot Olympiad):小中高生向けの自律ロボ国際コンテスト、日本予選〜国際大会。(wroj.org)

どれが“Mapless × Scout E”と相性いい?

  • つくばチャレンジ:屋外歩行者環境でTeach-&-Repeat+VPR/ToF+IMU回避の実証に最適。
  • WRS(シミュ or 実機の過酷環境):安全シールドや省電力推論など社会実装要素を盛り込みやすい。
  • F1TENTH(模擬レース)経路計画・追従のE2E/RLを短サイクルで検証可能。

気になる分野(屋外巡回・防災・レース・水中/ドローンなど)を教えてくれれば、参加要件・スケジュール・最低限の機材/書類を1ページでまとめます。