« 2008年08月08日 | Top2008年08月10日 »

最新記事【2008年08月09日】

もちろん音声入力にも欠点はあります。まずはやっぱり誤変換の時に修正に時間がかかってしまうということでしょう。タイピングによる入力であれば、変換の際、最初に違う漢字が表示されたとしても、スペースキーを押せば違う候補がすぐに出てきますので修正するのは簡単です。
ところが音声入力の場合は、間違った変化がなされたとき、または誤認識されてしまったときは、いちいち修正コマンド使わなければなりません。マウスを使って間違った部分を選択して見直すということはできるのですが、それらのソフトがユーザーのボキャブラリーを覚えてくれませんから、その後はいつまでたっても賢くなってくれないということになります。
ただこの点は、ソフトが賢くなってくれさえすれば、かなり欠点をカバーできるようになると期待はできます。

それから別の欠点として、ユーザーの言い間違えをそのまま表示してしまうということもあります。喋ってると、噛んでしまうことってよくありますよね。ありませんか?私だけでしょうか?ありますよね…
ちょっと閉口してしまったのが、エアコンの使い過ぎで鼻水をたらしてたんですけど、その鼻をすする音が表示されてしまったということです。私が鼻をすするたびになぜか数字の「4」が表示されてしまいます。「し」って聞こえてしまうようですね。これを何とか無視するように教えることはできないのか調べてみる必要があります。

あと欠点といいますと、やっぱりしゃべり方がはっきりしない人には不利だということです。私もあまりはっきりしゃべる質ではないのでまだまだ誤認識が多く文書作成に手間取ってしまいます。

そうそう重大な欠点を思い出しました。このソフトは一人しか使えないということですね。いや使えないことはないと思いますけど、やっぱり恥ずかしいじゃないですか。人がいるところでこれを使うのは。だってパソコンに向かってブツブツ言ってるんですよ、ひとりで。オフィスにおいて大勢で使うのもどうかと思います。大勢の社員がパソコンに向かってブツブツ言ってるんですよ。なんだか変じゃありませんか。

音声入力の利点というと、入力が早いこともあるのですが、手を使わなくても入力できるということが大きな利点となります。まあ当たり前なのですけど。
例えば、本を読みながらその内容をパソコンに入力していくという作業することもありますが、キーボードを使う場合ですと、まず本を開いて机のどこかに固定しないといけません。で、おわかりの通りこの本がたまに勝手に閉じたりしてしまいます。そうするとまたページを開いて固定して…ということになってしまって結構ストレスが溜まります。それに私の場合視力が低いものですから、かなり近いところに本をおかないと文字が見えないのですよね。だから結構大変な作業になってしまいます。目は疲れるし、肩は凝るし…
その点は音声入力で有れば楽です。マイクはヘッドセットで固定してありますし、本は手で持って自由にめくれますし。
それから手を使わずに済む利点といえば、これまた当然のことですが、手を怪我してしまったときに便利ですよね。私の場合パソコンで文字を書くのが仕事のようなものですから、手を怪我してしまっては商売上がったりなわけです。でもおかげさまで、その不安はほとんどなくなりました。手を怪我する代わりに風邪で喉を痛めてしまった場合に音声入力ができるのかどうかちょっと不安です。
あとは手を使わないわけですから、腱鞘炎になる心配はありませんね。その代わりに喉がかれるかもしれませんけど。
キーボードを使わなくていいということで、姿勢が固定されませんから、肩とか腰がいたくなったりということが少なくなるかもしれません。パソコンの使い過ぎによるVDT症候群というのがありますが、これの軽減が期待できるということです。
利点ばかりならべていましたけどもちろん欠点もありますから、欠点については別項で取り上げてみたいと思います。

もうタイピングが得意であれば音声入力ソフトは必要ないんじゃないかと思うかもしれません。私なんかタイピングはそんなに得意じゃなくっても音声入力ソフトなんかいらないって思っていましたから。
結局のところタイピングと音声入力でどっちが早いかという話になりますけど、これはおそらく音声入力に軍配が上がると思います。
私のタイピング歴はおそらく10年くらいあると思いますが、スピード的には使い始めてまだ1週間も経っていない音声認識ソフトとそれほど変わりません。ちょっと情けない気がしますけど。タイピングを上達させるにはかなりの努力が必要なんじゃないかと思いますが、音声入力ソフトはそうでもありません。文章を読み上げて上げれば勝手にソフトが賢くなってくれますので、どんどん入力スピード上がっていきます。
それを考えると今現在タイピングが得意でも、音声入力ソフトを導入する価値は大いにあると思われます。
タイピングは苦手ならなおさらですね。音声入力ソフトはぜひとも使ってみたいものです。そんなに高くありませんし。特にお年を召した方にはオススメしたいソフトです。タイピングは苦手だから、まだできそうにないからパソコンを敬遠しているという人も多いかと思いますが、これなら問題なく入力作業を行なえるようになると思います。
あ、そうそう、タイピングの場合はローマ字入力をしている人がほとんどだと思いますが、これなどに打鍵動作が文字数に比べて増えてしまいますよね。例えば「か」と入力したいときでもローマ字であれば「KA」と入力しなければなりませんから。その点を考えれば入力スピードでは音声入力の方が圧倒的に有利になるでしょう。
そういえば昔は、親指シフトのキーボードというのがありまして、あれは日本語入力に特化していましたので非常にタイピングの速度をアップさせることができましたが、何故かなくなってしまいましたね。やっぱり外国人を使う場合があるということで、JIS規格に統一した方がコスト的に有利ということになったのでしょうか。いいものだっただけにもったいない。

ドラゴンスピーチには音声コマンドというものがあります。音声コマンドによってソフト自体を操作したり、また文章を書くときにカーソルを操作したり、コピーしたりペーストしたり、誤変換を修正したり、行を変えたり段落を変えたりということができます。
コマンドはたくさんありますが全部使わせることはありませんので、最低限自分にとって必要なものを覚えておけばいいと思います。
それでは次によく使う音声コマンドを挙げてみようと思います。

「マイク」
マイクを一時停止したり一時停止解除したりします。
「サンプルコマンド」
音声コマンドのサンプルを表示します。

「改行」
もちろん改行します。
「半角スペース」「全角スペース」
スペースを空けますが、キーボードのほうが早いですね。

「選択○○から○○」
あることばから別の言葉までを選択します。コピーの時に便利です。
「全部選択」
文章すべてを選択します。これもコピーの時に。
「選択解除」
選択を解除します。そのままですね。

「修正」
最後に言った語句を修正します。
「修正○○」
特定の言葉を修正します。たとえば、「テレビを見る」の「テレビ」を「TV」に変えたいときは、「修正テレビ」と言いますと、変換候補がずらっと出てきますので、その中から「~番を選択」と言えば、書き換えることが可能です。
この「修正」コマンドがもっとも使う機会が多いですね。それにこまめに修正してやることで、ソフトがどんどん賢くなっていきます。

「削除」
最後に言った言葉を削除します。もちろん「選択」してからの削除も可能です。
「バックスペース」
キーボードのバックスペースと同じですね。「バックスペース~回」で、言った回数だけバックしてくれます。


現在のところは以上の音声コマンドだけで事足りています。ただ使っていくうちに便利なコマンドを発見するかもしれませんので、その時はまたこのページに加筆していきます。

トレーニングによって認識能力がどれくらい変わるかを記録しておきました。

トレーニングは、ドラゴンバーのツールから「認識率向上センター」を選んで行います。

それから「トレーニングの追加」を選びます。

トレーニングの結果は以下のとおりになっています。

まずはインストール直後の音声入力から。

「インストール後、初めて使っていました。それに祖父母に、自動的に行なわれるものだけど、行っています。ソフトだ。生まれたての赤ちゃんといった状態です。認識率はかなり低いようです。ただ、初めての音声入力した。以上できているから幸せ。とはいうもののまだこんな状態では使い物になりませんね。こちらがしゃべったから、補助表示してくれるまでに、かなりのタイムラグがあります。それから、かなり雑音を拾うこともあります。ちょっといまやこの成果、七夕らしいのですが、あの素人が、「す」に変換されたりします。」

以上のようになりました。ちょっとその、日本語になっていないですね。それに反応がかなり遅かったら気がします。ということでこの後1時間ほど文章読み聞かせてみました。


1時間ほどトレーニングをした後の音声入力結果です。

「一応認識率工場センターのトレーニング追加の項目で、1時間ほどトレーニングしてみました。二つほどを御用意されている文章を読んでいました。反応が少し速くなったような気がします。ただ見ての通り、誤変換が少し混じっています。それにしてもたった1時間のトレーニングでかなり優秀になって泣きもします。この調子なら、1週間くらいトレーニングすれば、実用レベルになるんだないかと期待していますし。」

以上のようになりました。たった1時間のトレーニングでかなりレベルアップしています。しゃべり方としても特にはっきり喋るとか気を遣っておりません。ふつうに喋っています。これならかなり期待できそうですよね。


そしてさらに30分文章を読み聞かせてみました。

「さて、あれからまだ30分ほどトレーニングしました。ドラゴンスピーチの進歩のほどはいかなるものでしょうか?声でしゃべってみたところ、かなり調子がいいようです。あまり大きな声でもしゃべっていませんし、特にゆっくりしゃべっているわけでもありませんし、私の仮説はそんなに違法ではありませんし、それにしてはきちんとついてきてくれている感じです。「仮説はそんなに違法」と言うのは「かつぜつはそんなにいい方」と言いたかったのですが、これは認識してもらえなかったようです。特に「かつぜつ」という言葉がどうしても認識してもらえません。なぜかカツレツになってしまいます。」

「かつぜつ」という言葉はなかなか認識してもらえません。まあとにかく、私はいつもはっきりしゃべる方ではないので、仕方ないかなと思っています。


ということで最後に残った一つの文章読んでみました。

「またさらに、トレーニングを30分ほどしてみました。これでソフトに用意されていた文章は、すべて読んだことになります。こうしてみたところ、言葉にはちゃんとついてきてくれますし、小錦も減ったように思われます。と言ってるそばから間違ってくれました。小錦ではなくに誤認識。もう1回楽しみましょう。楽しみましょう、ではなくて、試してみましょう。誤認識。大丈夫なようです。ちょっと私の発音が悪いようですね。まあ、たった2時間のトレーニングで、ここまで進歩したのだから、上出来と言えるでしょう。これから使っていけばさらに成長してくれるのではないでしょうか。」

小錦はちょっといただけませんか、一応反応も早くなりましたし、すでに実用レベルといってもいいんではないでしょうか。

合わせて2時間くらいのトレーニングでしたか、それで十分実用に耐えるレベルに達したとは思われます。予想していたよりもはるかに優秀であることがわかりました。これなら文章を書くのも楽しくなりますよ。

このドラゴンスピーチというソフトは買ってすぐに使うと言うわけにはいきません。トレーニングをしなければなりません。私の場合買ってまだ日が浅いですからそんなにトレーニングをしたという訳ではありません。
ソフトに付属しているトレーニング用の文章を全部読んだというだけの話です。短めの文章が一つと長めの文章が三つ付いています。

これを全部読んでも2時間程度しかかかりません。
しかしこの文章を読むときにはちょっとした注意が必要でしょう。どういうことかといいますと、やはりここはいつもと同じように喋るということが大事なのではないでしょうか。なぜかといいますと、ここでことさら大きな声でしゃべったり、いつもよりも意識してはっきりと喋るとしたりすると、ソフトはその大きな声やはっきりした発音をあなたの喋り方として記憶してしまいます。そうするといざ実用の場面においてなかなかあなたの喋り方を聞き取ってくれないということになるかもしれません。実際に使うときにいつもより大きな声や意識してはっきり喋らなければならないとしたら、これは疲れてしまいますからね。
それにしても四つ用意されているうちの1番上に出ている短めの文、これ全部読みきるのもそんなに疲れないのですけど、他の三つがかなり長いですから全部読み切るためにはそれなりの覚悟が必要です。時間がる程度とれるときに読んだほうがよいでしょう。とはいうものの30分程度なんですけどね。
私は一気に全部読んでしまいましたか、少しずつ読んでも大丈夫なようですので、気楽にトレーニングしてあげると良いと思います。最初はなんだか言葉も知らない子供のですが、たった2時間のトレーニングで見違えるように進歩してしまいます。人間ではまずありえない物覚えの良さですね。

ドラゴンスピーチというソフトには三つのバージョンがあるのですが、
それぞれの違いを一応説明しておきましょう。
三つのバージョンと言うのは、プロフェッショナル、セレクト、セレクトUSB、そしてパートナーということになっています。もちろんこのなかで1番高いのはプロフェッショナルで、1番安いのが私が持っているパートナーというバージョンです。ちなみに値段的にはプロフェッショナルが4万円以上、セレクトが2万円弱、セレクトUSBが2万円前後、そしてパートナーが6000円弱ということになっています。
セレクトとセレクトUSBの違いというのは、USBのマイクがついているかどうかというところです。USBのマイクの方が雑音には強いようです。雑音が多い環境でドラゴンスピーチを使うという人はUSBバイクのものを選んだ方が良いでしょう。

さてそれでは以下に場所をとる機能の違いを挙げておきます。

 
Professional
Select
Partner
主要アプリケーションへの直接文章入力
主要アプリケーションでの音声による文書の編集 ○(Dragonエディタのみ)
主要アプリケーションでの音声による修正作業 ○(Dragonエディタのみ)
音声によるパソコン操作(プログラムやフォルダの起動,ウィンドウの切替,メニューの操作など)
Dragonエディタ(音声認識対応の専用ワープロ)
句読点自動挿入
不要後の自動削除
クイックスタート
スピーチデータの再生と保存 ×
テキストの音声合成による読み上げ機能 ×
ICレコーダー、PDAからの文字化に対応 ×
ユーザーファイルの外部保存 ×
アルファベット,数字,記号などの音声入力
単語の追加(特殊な単語を含む文書、電子メールのアドレス帳,送信メール、Microsoft IMEなどからの追加)
言語モデルの最適化(送信メールやファイル内の文書をスキャンして、文の構造や単語の使用頻度を分析)
音声によるMicrosoft IE画面のナビゲーション(スクロールバーの移動,ページの切替など)
音声によるネットサーフィン(リンクのクリック,テキストボックスへの入力,ボタンの操作)
音声によるMicrosoft Outlook(Express)の基本操作(宛先の指定,送受信など) ×
ナチュラルランゲージ音声コマンド(Microsoft Word、Outlook、Outlook Express) ×
音声による定型テキスト・画像の貼り付け ×
ボキャブラリ作成ツール:NaturalVoc Tool(専門用語が多く含まれている文章の認識精度を大幅に向上) × ×
ボキャブラリ(辞書+言語解析モデル)の切替 × ×
独自の音声コマンドの作成と編集 × ×
独自の音声コマンドのインポート・エクスポート × ×
英語(5カ国)の音声認識 × ×

この表を見ますとパートナーバージョンではドラゴンエディタ以外で文書の作成ができないような印象を受けますが、文章を作るだけならドラゴンエディタ以外のエディタも使いますし、ブログに書き込んだりすることもできます。
あと気になるのはパートナーバージョンではICレコーダーは使えないという点です。これは、外での取材にこのソフトを活用したい人にとっては致命的ですので、そういう用途に使いたい人はパートナーバージョンを選ぶべきではありません。
あとは英語の音声認識を必要としている人はプロフェッショナルを選ぶしかなさそうです。ちょっと高いんですけどね。
外では使う予定はないし、英語で使う予定もないという人はパートナーで十分だと思います。

ソフトのインストールが終わりますと、次に「オーディオセットアップウィザード」というのが始まります。
これは簡単にいますと、マイクの調整ですね。

最初に出てくるのかパソコンに装備されているサウンドシステム選択ですが、これはデフォルトというのを選んで次に進めばOKでしょう。

それから次にマイクの位置の調整ということになります。

これはそんなに神経質にならなくても適当で良いと思います。とりあえず口の前にマイクが来るようにしておけば大丈夫でしょう。ちなみに私の場合、頭が大きすぎるのかヘッドセットが頭にフィットしませんので、後頭部から耳の上あたりをはさんで貰ってる形になっています。

その後に音量チェックということになります。

ここは普通の声で話すことが大事でしょう。あまり大きな声でも小さな声でもなく日常と変わらないしゃべり方をすることが必要です。

次に音質チェックことになります。

ここも先ほどと同じように画面に出ている文章普通の声で読み上げるというだけのことです。
しかし!
私の場合これを何度やってもOKがもらえないのです。もう10回くらい試してみたのですが、すべてエラーということになっていました。何度やってもだめだったので結局諦めて次に進むことにしました。これでソフトが使えないんじゃないかと不安にもなりましたけど、一応今のところ使えているようなので安心しています。

さて音量チェックと音質チェックが終わったとは自動的にチュートリアルが始まると思います。このチュートリアルで基本的なことを学ぶことができます。これは流れに沿ってそのまま進んでいけばいいと思います。ちなみに音声による案内ですから、スピーカーかヘッドフォンで聴ける状態にしておいた方が良いでしょう。
ちなみに私の場合は上述のような理由から付属ヘッドセットのフォント部分は機能させていません。音声はスピーカーから聞いています。それで支障はありませんから心配はありません。

私の場合は新規インストールになります。
インストールは特に難しくはありません。ソフトが収められているCDをCDドライブに入れれば自動的にインストールが始まると思います。

まずはセットアップウィザードが立ちあがりますので「次へ」をクリックします。
それから次に使用許諾契約、これは「はい」を選ばないことには前に進めませんので「はい」を素直にクリックしていきましょう。
次にユーザー名を書き込みます。私はとりあえず自分の名字をローマ字で入れておきました。それからシリアル番号を入力します。これはソフトに添付されているはがきにシリアル番号というのが印刷されていますのでそれを入力します。
ただしシリアル番号が2種類印刷されていますので、インストール用の方を使ってください。私の間違いでもう一つのほう入力してちょっとだけパニックになりましたのでみなさんも気をつけてくださいね。

次にインストール先のフォルダを選ぶことになります。これは任意のフォルダで良いのですが、よくわからない人はそのままで進んで大丈夫です。

これであとはソフトがフォルダにコピーされましてインストールが完了ということになります。その後に利用者登録がありますがこれはお好みで結構だと思います。ちなみに私がまだ登録していません。そのうちするつもりです。

最後に完了をクリックするとインストールが終るわけですけど、このときに「クイックスタートを有効にする」という項目を選べるようになっています。ここをチェックするとパソコン起動時に自動的にドラゴンスピーチが立ち上がるようになるのだと思います。そうするとパソコン起動自体に時間がかかるようになりそうなので私はチェックを入れませんでした。

とりあえずこれでインストールは終了です。
この後に引き続いてマイクの位置の調整や音声チェック・音質チェックが行われます。それについては別項で説明しようと思います。

ドラゴンスピーチの動作環境は以下の通りになっています。

CPU:PentiumⅢ500MHz以上
メモリー:128MB以上(256MB以上推奨)
OS:WindowsXP/2000/ME/98SE
Internet Explorer5以上
ハードディスクの空きが350MB以上
ヘッドホン出力、およびマイク入力(3.5ミリ4ミニジャック)を備え、16bit/11kHz以上で録音が可能なオーディオデバイス
CD-ROMドライブ(ソフトのインストール用)
(ヘッドセットが同梱されています)


ということなのですがおそらくぎりぎりではなかなか満足に働いてくれないと思います。私の場合は期待以上に動いてくれていますので参考までに私のパソコンの環境を書いておきます。
CPUはAthlon64-3200+、メモリーは1GB、OSはWindowsXP、Internet Explorerは7ということになっています。

おそらく最近のパソコンであればだいたい要求スペックはクリアできるんじゃないかと思います。PentiumⅢ500MHzというと10年近く昔のパソコンなんじゃないでしょうか。今ならノートパソコンだって1ギガヘルツを超えているのが普通ですから、パソコンのスペックに関してはそれほど心配いらないじゃないかと思います。

音声入力ソフトのススメ

音声入力ソフトは使えないというイメージがありましたが食わず嫌いはよくないということで実際に使ってみることにしました。ドラゴンスピーチというソフトです。