音声文字起こし副業の需要

会議・インタビュー・セミナー・ポッドキャストの文字起こし需要は企業・メディアを問わず恒常的にあります。OpenAIのWhisper APIを使えば音声→テキストの変換を高精度・低コストで自動化でき、副業収入を得られます。

Whisper APIの基本的な使い方

import openai
client = openai.OpenAI()
with open("meeting.mp3", "rb") as audio_file:
    transcript = client.audio.transcriptions.create(
        model="whisper-1",
        file=audio_file,
        language="ja",
        response_format="text"
    )
print(transcript)

コスト目安は$0.006/分(1時間の音声≒約100円)と非常に安価です。

副業サービスメニューと単価

サービス 内容 単価
文字起こしのみ 音声→テキスト変換 1分=30〜80円
文字起こし+校正 ケバ取り・誤字修正 1分=80〜150円
議事録整形 話者分離・要点整理 1分=200〜500円
要約レポート A4・1〜2ページ 5,000〜2万円

月収シミュレーション

1日に1時間音声を2〜3件処理すると、月収2〜5万円が現実的です。士業事務所(弁護士・税理士)や企業の管理部門への法人営業、クラウドワークスの「文字起こし・議事録」カテゴリから案件を探しましょう。

文字起こし副業は「スキルより環境整備」が重要です。WhisperのAPI費用・軽量PCさえあれば誰でも始められます。

副業を始めるならこちらもおすすめ

クラウドワークスで副業案件を探す