音声入力と生成AIの組み合わせが強い——マイク選びの試行錯誤を添えて

今年に入ってから、音声入力を使っている。きっかけはAqua Voiceというアプリを試したことだった。サブスクの課金が必要だし、最初は半信半疑だった。ところが1ヶ月も経たないうちに手放せなくなった。

目をつぶって、考えながら話せる。思考と入力が一つになる感覚がある。そうやって使ってみて初めて、キーボードで書いていたときは「考えること」と「打ち込むこと」が別の作業だったと気づいた。

ただし、音声入力が単体で素晴らしいかというと、そうでもない。一般的な音声入力には誤変換が混ざるし、「あー」「えー」といったフィラーもそのまま文字に起こされてしまう。Aqua Voiceはここが違う。音声をただ文字に起こすのではなく、AIが前後の文脈を読み取って最適な入力内容を生成してくれる。フィラーは取り除かれるし、滑舌の悪さや単純な誤変換はどうしても残るが、それでも話したまま出てくるのとは別物だ。

そしてその先に、もう一段ある。Aqua Voiceが生成したテキストを受け取るClaudeやChatGPTといった生成AIが、多少の誤変換や内容の欠落があっても文脈で意訳して読み取ってくれる。音声からテキストになるときに一度、テキストを生成AIが読み取るときにもう一度。二重のAIが間に入ることで、効果が倍増する。この組み合わせの相性は絶大だと思う。

***

Aqua Voiceのおかげで音声入力はめちゃくちゃ快適になった。ただ、使い続けるうちに、徐々にマイク環境への不満が出てきた。

最初に使ったのは、手元にあったAnker PowerConf H700。Web会議用のワイヤレスヘッドセットだ。マイクとしては問題ないが、耳を覆うタイプなので長時間つけていると痛くなる。Web会議でも感じていたことだが、一日中つけるとなると徐々に耐えられなくなってきた。

手元にはスピーカーフォンもあった。ただ、PCに向かって一人でボソボソ話すこと自体に、最初はどうにも違和感があった。慣れの問題かもしれないが、口元にマイクがないまま空間に向かって話す感じが落ち着かない。口元にマイクが欲しいと思った。

次に試したのがBOYAのワイヤレスピンマイク。5グラムと軽く、服にクリップで留められる。マイクが口元に近いので、ボソボソ話すことへの心理的な抵抗が薄れた。

ただ、使っていくうちに小さなストレスが積もっていった。充電ケースから取り出して服につける手間。席を離れて戻ると接続が切れていること。面倒になって机に置いて使うと、マイクの向きによって声が拾えず入力が欠落する。つけていることを忘れるほど軽いのがピンマイクの良さだが、その「忘れる」が服を脱ぐときに裏目に出る。洗濯機に入れたことはないが、いつかやるだろうなとは思っていた。

YouTuberが使っているような、アームで固定する据え置き型のマイクも一瞬考えた。ただ、一人でボソボソ話す音声入力には大げさすぎる。顔に追従してくれないので、マイクの方向を意識しなければならない。口元にマイクがあるほうが気持ちとして楽だ。一人での音声入力にも、Web会議にも、そこまでのものは要らない。

最終的にたどり着いたのが、Shokz OpenComm2という骨伝導ヘッドセットだ。1ヶ月以上悩んだ。値段がネックだった。けれど、他のデバイスで感じていたストレスのほうが勝った。

骨伝導なので耳を塞がず、長時間つけても痛くならない。マイクが口元にあるから声の欠落がない。頭に装着するのでピンマイクのように外し忘れることもない。連続稼働時間も長く、バッテリーをそう頻繁に気にしなくていい。

***

音声入力を始めて3ヶ月以上が経った。Aqua Voiceと生成AIの組み合わせは、自分の仕事の入力環境を大きく変えた。これは自信を持っておすすめしたい。

デバイスについては、Shokzの骨伝導ヘッドセットを使い始めてまだ日が浅い。ただ、今のところこれまでのストレスがすべて解消されていて、快適に使えている。合うデバイスは人それぞれだと思うが、一つ言えるのは、音声入力を快適に続けるにはアプリだけでなくマイク環境も大事だということだ。ちょっとしたストレスが積もると、せっかくの音声入力から遠ざかってしまう。自分がそうなりかけたから、よくわかる。


本文中で紹介したAqua VoiceにはProプランの無料体験つきの紹介リンクがあります。以下のリンクから登録すると、Proプランを1ヶ月無料で試せるらしいので、興味のある方はどーぞ。

Aqua Voice 紹介リンク(Pro 1ヶ月無料)