Geminiで文字起こしする方法をお探しですね。
広告
会議やボイスメモを無料で文字起こし!Geminiを使った超便利テクニック
会議の録音やふと思いついたアイデアのボイスメモ、あとで聞き返すのって面倒ですよね。
自分で文字に起こすとなると、1時間の音声に3〜4時間かかることも珍しくありません。
でも実は、Googleの生成AI「Gemini(ジェミニ)」を使えば、この面倒な作業がびっくりするほど簡単になるんです。
今回は、Geminiで音声を文字起こしする基本的な方法から、長時間の音声も無料で処理できる裏ワザ、さらに議事録として使えるレベルに整える方法まで、わかりやすく紹介します。
Geminiで音声を文字起こしする基本のやり方
Googleが作ったAI「Gemini」は、文章だけじゃなくて音声や画像も理解できる賢いAIです。
だから、録音した音声ファイルやボイスメモをそのままアップロードするだけで、内容を理解しながら正確に文字起こししてくれます。
普通の音声認識ツールと違って、Geminiは前後の文脈を読み取れるので、同じ読み方の言葉(例えば「橋」と「箸」)もちゃんと使い分けてくれるし、専門用語も適切に変換してくれるのが強みです。
使い方はとってもシンプル。
Geminiのチャット画面を開いて、テキスト入力欄の横にあるプラスマーク(または📎のようなアイコン)をクリック。
そこからスマホやパソコンに保存してあるmp3やm4aなどの音声ファイルを選ぶだけです。
ファイルを追加したら、「この音声を一言一句漏らさずに文字起こししてください」と入力して送信。
すると数分で文字になって出てくるので、特別な知識は一切いりません。
ただし、無料版のGeminiには制限があります。
短いボイスメモや10分程度の音声なら問題ないんですが、1時間を超えるような長い会議の録音だと、途中でエラーになったり処理が止まったりすることも。
そんな時は、次に紹介する裏ワザを使えば、無料のまま長時間の音声も処理できますよ。
長い音声も無料でOK!「Google AI Studio」の裏ワザ
何時間もあるセミナーや長い会議の録音を無料で文字起こししたいなら、「Google AI Studio」という開発者向けのツールを使うのが一番です。
「開発者向け」って聞くと難しそうですが、実はGoogleアカウントがあれば誰でも無料で使えるんです。
しかも、普通のGeminiよりずっと大きなファイルを一度に処理できます。
特に「Gemini 1.5 Pro」という最新モデルを選ぶと、数時間分の音声でも途切れずに一気に文字起こしできちゃいます。
使い方はこんな感じです。
**Google AI Studioの使い方**
1. Google AI Studioのサイトにアクセスして、Googleアカウントでログイン
2. 新しいプロンプトを作成する画面を開く
3. 右側の設定で「Gemini 1.5 Pro」を選ぶ
4. プラスボタンから音声ファイルをアップロード(Googleドライブからでも、パソコンから直接でもOK)
5. 「この音声を文字起こししてください」と入力して実行
英語の画面が出てくることもありますが、ブラウザの翻訳機能を使えば大丈夫。
基本的にはファイルをドラッグ&ドロップして指示を出すだけなので、プログラミングの知識がなくても全然使えます。
ただし、長い音声を処理するので結果が出るまで数分から10分くらいかかることがあります。
その間は他のことをしていればOK。
あと、今のところ「Aさんが話している」「Bさんが話している」みたいに話者を自動で分けてくれる機能は完璧じゃないので、セミナーや講義、一人の人が長く話す会議の録音に向いています。
スマホのボイスメモから直接文字起こしする方法
「あ、いいこと思いついた!」とスマホのボイスメモに録音したもの、パソコンに移すのって面倒ですよね。
実は、iPhoneやAndroidのボイスメモアプリで録音した音声は、パソコンを使わずにスマホだけで文字起こしできるんです。
電車の中やカフェで、サッと文字にできるのでめちゃくちゃ便利です。
**iPhoneの場合**
1. ボイスメモアプリで録音したファイルを選ぶ
2. 共有ボタン(□に↑のマーク)をタップ
3. 「ファイルに保存」を選んで、iPhoneやiCloudに保存
4. SafariやChromeでGeminiのサイトを開く
5. ファイル添付のアイコンから、さっき保存した音声を選ぶ
6. 「この音声を日本語で文字起こしして」と入力して送信
**Androidの場合**
1. 録音アプリから音声ファイルを内部ストレージかGoogleドライブに保存
2. ブラウザでGeminiを開く
3. 保存したファイルを選んで文字起こしの指示を出す
**スマホから使う時の注意点**
– Wi-Fiがない場所でやると、スマホのデータ通信量をけっこう使います
– 音声ファイルは容量が大きいので、長すぎるとアップロードが途中で切れることも
– 長い録音は15〜30分くらいに分けて保存しておくと安心です
文字起こしデータを読みやすい議事録に変える魔法の言葉
音声を文字起こししたばかりのデータって、「えー」とか「あのー」とか、話し言葉そのままなので、そのまま資料として使うのは難しいですよね。
これを手作業で直すのはすごく大変ですが、Geminiならこの作業も一瞬です。
文字起こしが終わったら、続けてこんな風に指示を出してみてください。
**おすすめの指示文(プロンプト)**
「あなたは優秀な編集者です。
以下の文字起こしデータから『えー』『あのー』などの不要な言葉を削除して、内容は一切省略せずに、話し言葉を自然な文章に直してください。
最後に、重要な決定事項と次にやるべきことをまとめてください。
」
こんな風に指示すると、意味を変えずに読みやすい文章に整えてくれて、さらに要点までまとめてくれます。
議事録としてそのまま使えるレベルになるので、かなり時短になりますよ。
**うまく整形するコツ**
– 「あなたは〇〇です」と役割を与える(編集者、書記など)
– 何をしてほしいか具体的に書く(不要な言葉を削除、話し言葉を文章にする、など)
– どんな形で出力してほしいか伝える(全文出力、最後に要約を追加、など)
ただし、AIはとても優秀ですが、たまに専門用語を間違えたり、文脈を勘違いしたりすることもあります。
だから、出来上がった文章はそのまま使わずに、必ず最後にサッと目を通して、元の音声と違うところがないかチェックしてくださいね。
まとめ
Geminiを使えば、これまで何時間もかかっていた文字起こし作業が、ほんの数分で終わります。
しかも無料で使えるので、会議の記録、セミナーのメモ、アイデアの整理など、いろんな場面で活躍してくれますよ。
ぜひ試してみてください!
広告
