よくある質問 - 完全ローカル文字起こし

Q: ライセンスは必要ですか？

個人での非営利利用の場合は無料でお使いいただけます。商用利用の場合はライセンス購入が必要です。個人での利用でも『自動文字起こしフォルダ』や『単語登録機能』を利用したい場合は、ライセンス登録が必要です。

Q: どれぐらい高精度に文字起こしされますか？

WhisperXモデルを使用しており、雑音環境でも高精度な文字起こしが可能です。具体的な精度は音声の品質や話し方によりますが、一般的には95%以上の精度を目指しています。

完全ローカル文字起こしは、OpenAIの文字起こしAI（WhisperX）やデータを最初にパソコンへまとめてダウンロードしておきます。
実際に使うときは、ネットにつながず、あなたのパソコンの中だけですべての処理が完了。音声データは一切外に出ないので、安心してご利用いただけます。

個人での非営利利用の場合は無料でお使いいただけます。商用利用の場合はライセンス購入が必要です。
個人での利用でも「自動文字起こしフォルダ」や「単語登録機能」を利用したい場合は、ライセンス登録が必要です。
ライセンス登録は、こちらから行えます。

WhisperXモデルを使用しており、雑音環境でも高精度な文字起こしが可能です。
具体的な精度は音声の品質や話し方によりますが、一般的には95%以上の精度を目指しています。
サンプル動画を文字起こした場合の例です。赤字は文字起こしミスを示しています。

過去の文字起こしデータをAIが自動でチェックし、同じ意味なのに書き方が違う単語（表記ゆれ）の候補をまとめて見つけてくれます。
そのまま一覧から簡単に単語登録できるので、手作業で探す手間なく効率よく用語を統一できます。

また、janome形態素解析を行い単語を変換できます。janomeは、日本語の文章を単語ごとに分けるツールです。
例えば、「私はリンゴを食べます」という文章を分解して、「私 / は / リンゴ / を / 食べ / ます」といった形で単語ごとに分けることができます。
「私はリンゴを食べます」→「私 / は / リンゴ / を / 食べ / ます」のように分解できます。
さらに、それぞれの単語が「名詞」「動詞」など、どんな言葉かも自動で判別します。

ダウンロード後、ZIPファイルを展開します。

解凍したフォルダ内にある「完全ローカル文字起こしツール.exe」をダブルクリックすることで起動できます。

パソコンの処理速度によりますが、ローカルで文字起こしさせるための準備のため、起動時には時間がかかります。

ライセンス登録後、メールを開き以下手順で認証します。

メールアドレスとライセンスキーを入力し、「認証」ボタンをクリックします。

ライセンス登録はこちらのページから行えます。

ダウンロードファイルが大きいのは、音声認識モデルや辞書データが含まれているためです。これにより、高精度な文字起こしが可能になります。
ファイルはウイルスチェック済みで、インストール後も安全にご利用いただけます。

文字起こしされる言語は、設定画面から変更できます。

言語を選択し、「OK」ボタンをクリックすることで変更が反映されます。

主要な言語は以下の通りです。

英語、フランス語、ドイツ語、イタリア語、スペイン語、ポルトガル語、オランダ語、ロシア語、ウクライナ語、チェコ語、ポーランド語、スロバキア語、ハンガリー語、スウェーデン語、デンマーク語、フィンランド語、ノルウェー語
日本語、中国語（北京語、広東語）、韓国語、タイ語、ベトナム語、インドネシア語、ヒンディー語、アラビア語、トルコ語
その他：エストニア語、リトアニア語、スロベニア語、クロアチア語、セルビア語、ギリシャ語、ヘブライ語、ペルシャ語、ウルドゥー語、タガログ語、マレー語、スワヒリ語、ズールー語など

全96言語に対応していますが、訛りや方言、会話スピードには弱い傾向があります。

一部の言語（例：アフリカ諸国のローカル言語など）は音声認識の精度が著しく低くなることがあります。

自動判別は「ほぼ大丈夫」ですが、低リソース言語では誤認識が多くなる場合もあります。

タイムスタンプ機能とは、音声データの特定の時間に対応するテキストを表示する機能です。
これにより、ユーザーは音声のどの部分がどのテキストに対応しているかを簡単に確認できます。
特に長時間の録音や会議の文字起こしにおいて、特定の発言を迅速に見つけるのに役立ちます。
タイムスタンプ機能は、設定画面から有効にすることができます。音声データを再生しながら、特定の時間に対応するテキストを確認できます。