Geminiで文字起こしする方法をお探しですね。

広告

会議やボイスメモを無料で文字起こし!Geminiを使った超便利テクニック

会議の録音やふと思いついたアイデアのボイスメモ、あとで聞き返すのって面倒ですよね。

自分で文字に起こすとなると、1時間の音声に3〜4時間かかることも珍しくありません。

でも実は、Googleの生成AI「Gemini(ジェミニ)」を使えば、この面倒な作業がびっくりするほど簡単になるんです。

今回は、Geminiで音声を文字起こしする基本的な方法から、長時間の音声も無料で処理できる裏ワザ、さらに議事録として使えるレベルに整える方法まで、わかりやすく紹介します。

Geminiで音声を文字起こしする基本のやり方

Googleが作ったAI「Gemini」は、文章だけじゃなくて音声や画像も理解できる賢いAIです。

だから、録音した音声ファイルやボイスメモをそのままアップロードするだけで、内容を理解しながら正確に文字起こししてくれます。

普通の音声認識ツールと違って、Geminiは前後の文脈を読み取れるので、同じ読み方の言葉(例えば「橋」と「箸」)もちゃんと使い分けてくれるし、専門用語も適切に変換してくれるのが強みです。

使い方はとってもシンプル。

Geminiのチャット画面を開いて、テキスト入力欄の横にあるプラスマーク(または📎のようなアイコン)をクリック。

そこからスマホやパソコンに保存してあるmp3やm4aなどの音声ファイルを選ぶだけです。

ファイルを追加したら、「この音声を一言一句漏らさずに文字起こししてください」と入力して送信。

すると数分で文字になって出てくるので、特別な知識は一切いりません。

ただし、無料版のGeminiには制限があります。

短いボイスメモや10分程度の音声なら問題ないんですが、1時間を超えるような長い会議の録音だと、途中でエラーになったり処理が止まったりすることも。

そんな時は、次に紹介する裏ワザを使えば、無料のまま長時間の音声も処理できますよ。

長い音声も無料でOK!「Google AI Studio」の裏ワザ

何時間もあるセミナーや長い会議の録音を無料で文字起こししたいなら、「Google AI Studio」という開発者向けのツールを使うのが一番です。

「開発者向け」って聞くと難しそうですが、実はGoogleアカウントがあれば誰でも無料で使えるんです。

しかも、普通のGeminiよりずっと大きなファイルを一度に処理できます。

特に「Gemini 1.5 Pro」という最新モデルを選ぶと、数時間分の音声でも途切れずに一気に文字起こしできちゃいます。

使い方はこんな感じです。

**Google AI Studioの使い方**

1. Google AI Studioのサイトにアクセスして、Googleアカウントでログイン
2. 新しいプロンプトを作成する画面を開く
3. 右側の設定で「Gemini 1.5 Pro」を選ぶ
4. プラスボタンから音声ファイルをアップロード(Googleドライブからでも、パソコンから直接でもOK)
5. 「この音声を文字起こししてください」と入力して実行

英語の画面が出てくることもありますが、ブラウザの翻訳機能を使えば大丈夫。

基本的にはファイルをドラッグ&ドロップして指示を出すだけなので、プログラミングの知識がなくても全然使えます。

ただし、長い音声を処理するので結果が出るまで数分から10分くらいかかることがあります。

その間は他のことをしていればOK。

あと、今のところ「Aさんが話している」「Bさんが話している」みたいに話者を自動で分けてくれる機能は完璧じゃないので、セミナーや講義、一人の人が長く話す会議の録音に向いています。

スマホのボイスメモから直接文字起こしする方法

「あ、いいこと思いついた!」とスマホのボイスメモに録音したもの、パソコンに移すのって面倒ですよね。

実は、iPhoneやAndroidのボイスメモアプリで録音した音声は、パソコンを使わずにスマホだけで文字起こしできるんです。

電車の中やカフェで、サッと文字にできるのでめちゃくちゃ便利です。

**iPhoneの場合**

1. ボイスメモアプリで録音したファイルを選ぶ
2. 共有ボタン(□に↑のマーク)をタップ
3. 「ファイルに保存」を選んで、iPhoneやiCloudに保存
4. SafariやChromeでGeminiのサイトを開く
5. ファイル添付のアイコンから、さっき保存した音声を選ぶ
6. 「この音声を日本語で文字起こしして」と入力して送信

**Androidの場合**

1. 録音アプリから音声ファイルを内部ストレージかGoogleドライブに保存
2. ブラウザでGeminiを開く
3. 保存したファイルを選んで文字起こしの指示を出す

**スマホから使う時の注意点**

– Wi-Fiがない場所でやると、スマホのデータ通信量をけっこう使います
– 音声ファイルは容量が大きいので、長すぎるとアップロードが途中で切れることも
– 長い録音は15〜30分くらいに分けて保存しておくと安心です

文字起こしデータを読みやすい議事録に変える魔法の言葉

音声を文字起こししたばかりのデータって、「えー」とか「あのー」とか、話し言葉そのままなので、そのまま資料として使うのは難しいですよね。

これを手作業で直すのはすごく大変ですが、Geminiならこの作業も一瞬です。

文字起こしが終わったら、続けてこんな風に指示を出してみてください。

**おすすめの指示文(プロンプト)**

「あなたは優秀な編集者です。

以下の文字起こしデータから『えー』『あのー』などの不要な言葉を削除して、内容は一切省略せずに、話し言葉を自然な文章に直してください。

最後に、重要な決定事項と次にやるべきことをまとめてください。

こんな風に指示すると、意味を変えずに読みやすい文章に整えてくれて、さらに要点までまとめてくれます。

議事録としてそのまま使えるレベルになるので、かなり時短になりますよ。

**うまく整形するコツ**

– 「あなたは〇〇です」と役割を与える(編集者、書記など)
– 何をしてほしいか具体的に書く(不要な言葉を削除、話し言葉を文章にする、など)
– どんな形で出力してほしいか伝える(全文出力、最後に要約を追加、など)

ただし、AIはとても優秀ですが、たまに専門用語を間違えたり、文脈を勘違いしたりすることもあります。

だから、出来上がった文章はそのまま使わずに、必ず最後にサッと目を通して、元の音声と違うところがないかチェックしてくださいね。

まとめ

Geminiを使えば、これまで何時間もかかっていた文字起こし作業が、ほんの数分で終わります。

しかも無料で使えるので、会議の記録、セミナーのメモ、アイデアの整理など、いろんな場面で活躍してくれますよ。

ぜひ試してみてください!

広告