クラウド AI API の利用料金比較(2026年2月12日時点)

    概要

    複数の大手生成AIベンダー(Anthropic、OpenAI、Google、Cohere)の最新API料金を調査しました。価格は入力トークン出力トークンに分かれ、いずれも100万トークン(MTok)当たりの従量課金制です。引用元は各社の公式ドキュメントに基づいており、価格は米ドル(USD)表記です。日本円換算は2026年2月12日時点の為替レート(1USD ≒ 153.445円)で近似しています。表では長い説明文を避け、キーワードや数値のみを掲載しています。詳細な解説は表の後に記載します。

    API料金比較表

    以下の表では、各モデル/プランの1Mトークン当たりの価格をUSDとJPYで示します。欄外の「入力」はプロンプト(コンテキスト)に課金されるトークン、「出力」は生成されたトークンに課金されるトークンを意味します。JPY換算は概算であり、為替レートの変動により変わる可能性があります。

    各社の料金と特徴

    Anthropic(Claude)

    AnthropicのClaudeファミリーは、OpusSonnetHaikuの3系列があります。公式ドキュメントによると、現行世代で最も高性能なClaude Opus 4.6は100万入力トークン当たり5ドル、出力トークン当たり25ドルで、長文推論や複雑なタスクに向けています。中位モデルのClaude Sonnet 4.5は入力3ドル/出力15ドル、軽量モデルのClaude Haiku 4.5は入力1ドル/出力5ドルです。旧世代モデル(Haiku 3.5やHaiku 3)はさらに安価です

    特徴として、Anthropicはプロンプトキャッシュ機能を提供しており、同一プロンプトの再利用時に「Cache Hits」に対する料金(基本入力価格の10%)が適用されます。また、Amazon BedrockやGoogle Vertex AIなどサードパーティプラットフォーム経由での提供もありますが、料金体系はプラットフォームごとに異なります

    OpenAI

    OpenAIのAPIはモデルが多岐にわたります。公式料金ページによれば、2026年時点での主力はGPT‑5 シリーズで、標準モデルのGPT‑5.2は入力$1.75/出力$14です。高性能なGPT‑5.2 proは入力$21/出力$168、コストを抑えたGPT‑5 miniは入力$0.25/出力$2となっています。

    より低価格の旧世代モデルも提供されています。たとえば、GPT‑4.1(ファインチューニング用)は入力$3/出力$12GPT‑4.1 miniは入力$0.80/出力$3.20GPT‑4.1 nanoは入力$0.20/出力$0.80です。リアルタイム処理に特化したgpt‑realtimeは入力$4/出力$16、軽量版のgpt‑realtime‑miniは入力$0.60/出力$2.40と低価格で提供されます。さらに、入力トークンをキャッシュした場合には10%程度の割引が適用されます

    Google(Gemini API)

    Google AIのGeminiは、Flash系とPro系のモデルで構成されています。公式の料金表によると、次のような価格設定になっています:

    • Gemini 2.5 Flash(Standard):入力$0.30(テキスト/画像/動画)、出力$2.50。軽量版のFlash‑Liteは入力$0.10/出力$0.40で、高コスト効率を謳っています。バッチモードでは半額の入力$0.15/出力$1.25

    • Gemini 3 Pro プレビュー:プロンプトが20万トークン以下の場合、入力$2.00/出力$12。プロンプトが20万トークンを超えると入力$4.00/出力$18に上昇します。コンテキストキャッシュ保存は入力価格の約10%($0.20または$0.40)

    • Gemini 3 Flash プレビュー:入力$0.50/出力$3.00。バッチモードでは入力$0.25/出力$1.50。Flash系は高速レスポンスを重視しており、検索グラウンディングやGoogle 検索による追加課金が別途発生します

    これらの価格は標準プランを示しており、無料枠やバッチAPI利用時には割引が適用されます。Gemini APIでは「思考トークン」を含む出力価格の設定や、コンテキストキャッシュ保存料金、検索グラウンディング料金などが細かく定められています

    Cohere

    Cohereは企業向けの生成AI APIを提供しています。料金ページのFAQによると、主な言語モデル群は以下の料金で提供されています:

    • Command(従来モデル): 入力$1.00/出力$2.00

    • Command‑light: 入力$0.30/出力$0.60

    • Command R 03‑2024: 入力$0.50/出力$1.50

    • Command R+ 08‑2024: 入力$2.50/出力$10.00

    • Aya Expanse(研究モデル): 入力$0.50/出力$1.50

    これらの料金は「従来モデルの参考価格」であり、現在提供中のモデルについては営業への問い合わせが必要とされています。Cohereのサイトでは、料金が利用状況に応じて月末に請求され、$250を超えると請求が発生する旨が記載されています

    まとめ

    2026年2月時点での主要生成AI API料金を比較すると、Claude Haiku 4.5GPT‑5 miniGemini 2.5 Flash‑Liteが最も低価格帯(入力0.10〜0.30ドル程度)で、個人や小規模アプリケーションに適しています。一方、GPT‑5.2 proClaude OpusGemini 3 Proなどのフラッグシップモデルは入力が2〜21ドル、出力が12〜168ドル程度と高価ですが、長文推論や複雑なエージェントタスクに対応できます。また、多くのサービスでキャッシュトークンバッチAPIなどを活用することで、入力・出力コストを大幅に削減できる点も共通しています。

    価格は為替や各社の料金改定により変動するため、最新情報は必ず公式サイトで確認してください。

    あわせて読みたい