OpenAI使用料金　決済手段　あれこれ

2023年1月2日2026年5月18日

著者：副業の宮殿｜製造業に携わる現役エンジニア。技術士試験対策書籍をKindleで複数出版。技術ブログ「副業の宮殿」にて製造業DX・AI活用の情報を発信中。

Pricing

言語モデル　ベースモデル

〇Ada最速モデル
$0.0004 / 1K トークン

〇バベッジ
0.0005ドル/1Kトークン

〇キュリー
0.0020ドル / 1Kトークン

〇ダヴィンチ最強
0.0200ドル / 1Kトークン

複数のモデルがあり、それぞれ性能と価格帯が異なる。Adaは最も高速なモデルで、Davinciは最も強力なモデルです。

価格は1,000トークンあたりのものです。トークンは言葉の断片と考えることができ、1,000トークンは約750ワードに相当します。この段落は35トークンです。

利用限度額

使用量の上限を設定し、支出を管理することができます。利用限度額に達すると、Ownerロールを持つメンバーに対して通知メールが送信されます。

許可された利用限度額
OpenAIが毎月許可する利用限度額です。増額申請
$120.00

現在の使用量
これまでの使用量の合計です（UTC）。無料トライアルやその他のクレジットの利用が含まれている場合がありますので、毎月の請求額はここに表示されている値より少なくなる可能性があることに注意してください。使用記録を見る
$0.00

ハードリミット
お客様の組織が毎月この使用量のしきい値に達すると、それ以降のリクエストは拒否されます。
$120.00

ソフトリミット
毎月の使用量がこの制限値に達すると、通知メールが送信されます。
$96.00

よくある質問

〇トークンって何？

トークンは、自然言語処理に使われる単語の断片と考えることができます。英文の場合、1トークンは約4文字、0.75ワードに相当します。参考までに、シェイクスピアの著作集は約90万語、120万トークンです。

〇トークンの仕組みや使用量の目安は？

インタラクティブなトークン化ツールで試してみてください。
アカウントにログインして、テキストをプレイグラウンドに入力してください。フッターのカウンターが、テキストに含まれるトークンの数を表示します。
どのモデルを使うべきですか？
Davinciは一般的に最も高性能なモデルですが、他のモデルも特定のタスクを非常にうまく、場合によってはかなり速く実行することができます。また、コスト面でも有利です。例えば、CurieはDavinciと同じタスクの多くを、より速く、1/10のコストで実行することができます。開発者の皆様には、ご自分のアプリケーションに最も適したモデルを見つけるために、様々な実験をされることをお勧めします。より詳細なモデルの比較は、ドキュメントをご覧ください。

〇毎月使用したトークンの数を知るにはどうしたらいいですか？

アカウントにログインして、使用状況追跡ダッシュボードを表示してください。このページでは、現在および過去の課金サイクルで使用したトークンの数を確認できます。

〇使用量を管理するにはどうしたらいいですか？

課金設定で使用量のハードリミットを設定することができ、それを超えるとリクエストの配信が停止されます。また、ソフトリミットを設定することで、ある一定の使用量を超えるとアラートメールを受け取ることができます。

〇プレイグラウンドの利用はクォータに含まれますか？

はい、通常のAPI使用量と同じように扱われます。

〇コンプリーションの価格はどのように計算されますか？

補完リクエストは、プロンプトで送信されたトークンの数と、API で返された補完結果のトークンの数に基づいて課金されます。

best_of と n パラメータもコストに影響する場合があります。これらのパラメータはプロンプトごとに複数の完了を生成するため、返されるトークン数に対する乗数として機能します。

リクエストでは num_tokens(prompt) + max_tokens * max(n, best_of) トークンを使用することができ、このページの一番上に記載されているエンジンごとの料金で課金されます。

最も単純なケースでは、プロンプトに 10 個のトークンが含まれていて、davinci エンジンに 90 個のトークンによる補完を要求した場合、要求は 100 個のトークンを使用し、$0.002 の費用が発生します。

プロンプトの長さや最大応答長を短くする、best_of/n の使用を制限する、適切なストップシーケンスを追加する、トークンごとのコストが低いエンジンを使用するなどの方法でコストを制限することができます。

〇微調整の価格はどのように計算されますか？

Fine-tuningの価格設定には、トレーニングと使用の2つの要素があります。

Fine-Tuningされたモデルをトレーニングする場合、使用されたトークンの合計がトレーニング料金に従って請求されます。トレーニングトークンの数は、トレーニングデータセットのトークン数と、選択したトレーニングエポック数に依存することに注意してください。デフォルトのエポック数は4です。

(トレーニングファイル内のトークン * トレーニングエポック数) = トレーニングトークン数

モデルのファインチューニングを行うと、使用したトークンのみが課金されます。微調整されたモデルに送られたリクエストは、弊社の利用料金で課金されます。

〇Classificationの価格はどのように計算されますか？

Classificationsのリクエストは、あなたが提供した入力のトークン数に基づいて請求されます。内部的には、このエンドポイントは検索エンドポイントおよび補完エンドポイントを呼び出すため、そのコストはこれらのエンドポイントのコストの関数となります。

トークンあたりの実際のコストは、検索と補完を行うためにどのモデルを選択するかに基づいており、これはそれぞれ search_model と model パラメータによって制御されます。

検索するサンプルを含むファイルを提供することもできますし、リクエストの中で明示的にサンプルを指定することもできます。検索したいサンプルの数が max_examples よりも多い場合、ファイルを提供することで検索を高速化し、より高い費用対効果を得ることができます。このシナリオでは、コストは主に再ランクされた例の数 (max_examples で制御) とそれらの例の合計の長さに基づきます。代わりにリクエストで例を渡すと、コストはそれらのすべての例の合計の長さに基づきます。

モデルに渡されるクエリの長さと、最終的に生成される分類ラベルもコストに含まれます。

return_prompt デバッグフラグを使用すると、分類ラベルを生成するために completions エンドポイントに送信される最終的な複合プロンプトの長さを理解することができます。

〇Searchの価格はどのように計算されますか？

Searchリクエストは、提供するドキュメント内のトークンの総数と、クエリ内のトークン、および操作の実行方法をモデルに指示するために必要なトークンに基づいて課金されます。また、APIは参照ドキュメントを使用してレスポンスを生成するため、ドキュメント数の合計に1が加算されます。これらのトークンは、このページの一番上に概説されているエンジンごとの料金で課金されます。

検索対象となる文書を含むファイルを提供するか、リクエストの中で明示的に文書を指定することができます。検索したい文書の数がmax_rerankより多い場合、ファイルを提供することで検索が高速化され、コスト効率が良くなります。このシナリオでは、コストは主に再ランクされた文書数 (max_rerank で制御) とそれらの文書の合計の長さに基づきます。代わりにリクエストでドキュメントを渡す場合、コストはそれらすべてのドキュメントの合計の長さに基づきます。

以下に、全体のトークン消費量を計算するための式を示します。14はAPIがセマンティック検索のタスクを達成するためにドキュメントごとに使用する追加トークンを表し、追加された1は参照ドキュメントを表します。

すべてのドキュメントに含まれるトークンの数
+ (ドキュメント数 + 1) * 14
+ (ドキュメント数 + 1) * クエリのトークン数
= トークンの総数
例として、トークン長が12, 34, 22, 33, 78の5つのドキュメント（＋APIで追加した1つ）があり、クエリが8トークンだった場合、消費されるトークンの合計は以下のようになります。179 + (6 * 14) + (6 * 8) = 311

Search Token Estimatorを使用するか、Python Estimatorのコードを見て、サーチトークンの使用量をさらに理解することができます。

〇Answersの価格はどのように計算されるのですか？

Answers のリクエストは、提供する入力のトークン数とモデルが生成する回答に基づいて課金されます。内部的には、このエンドポイントは検索APIと補完APIを呼び出すため、そのコストはこれらのエンドポイントのコストの関数となります。

トークンあたりの実際のコストは、検索と補完を行うためにどのモデルを選択するかに基づいており、それはそれぞれsearch_modelとmodelパラメータによって制御されます。

検索するドキュメントを含むファイルを提供することもできますし、リクエストの中で明示的にドキュメントを指定することもできます。検索したい文書の数がmax_rerankより多い場合、ファイルを提供することで検索が高速になり、コスト面でも有利になります。このシナリオでは、コストは主に再ランクされた文書数 (max_rerank で制御) とそれらの文書の合計の長さに基づきます。代わりにリクエストでドキュメントを渡すと、コストはそれらすべてのドキュメントの合計の長さに基づいています。

例題、examples_context、質問、生成される答えの長さ (max_tokens/stopで制御) もコストに影響を及ぼします。

return_promptデバッグフラグを使用して、回答を生成するためにcompletesエンドポイントに送信される最終的な結合プロンプトの長さを理解することができます。

〇各種モデルのSLAはありますか？

近日中にSLAを公開する予定です。それまでは、ステータスページでサービスの可用性を監視し、過去の稼働時間を確認することができます。お客様の会社やアプリケーションに特定の要件がある場合は、当社の営業担当者にお問い合わせください。

〇Microsoft AzureでAPIを利用できますか？

はい、ご利用いただけます。Azureをご利用のお客様は、Azureが提供するコンプライアンス、地域サポート、エンタープライズグレードのセキュリティを備えたOpenAI APIをAzure上で利用することができます。詳細については、sales@openai.com までお問い合わせください。

〇日本で使用しているクレジットカードの支払いは海外のサイトでも使えますか？

はい、ほとんどのクレジットカードは海外でも使用できます。ただし、一部の国や地域では、特定の種類のクレジットカードが使用できない場合があることに留意してください。また、海外でのクレジットカード使用には手数料がかかることがあります。海外でのクレジットカード使用を計画される場合は、カード会社にお問い合わせください。