会議の議事録制作やインタビュー記事の制作に文字起こしは必項作業となります。
単純作業であるが故、多くの企業は外注する事が多いでしょう。
近年オンライン会議が増えることで録画した会議の映像、またはインタビュー動画から文字起こしをするという機会は多くなり、副業案件も多くなってきました。
そんななか、文字起こしを自動でできたらな。ソフトをインストールしたり、アプリではなく、webサイトから手軽に文字起こしできたらと感じる人は多いかと思います。
そこで今回はアプリやソフトをインストールする事なく、webサイト上で使用する事のできる文字起こしサービスを7つ紹介します。
失敗しないAI文字起こしツールの選び方
文字起こしサービスをいくつか紹介しますが、自分に合ったサービスをどう選べばよいのかをまず知ることが大切です。
最も基本となる「利用目的・用途」「費用」「セキュリティ」の3軸で解説していきます。
用途によって必要な機能は異なる
用途としては大きく分けて以下の3つにわけられるでしょう。
- 仕事での議事録
- 個人の副業
- 個人の勉強
仕事での議事録
仕事での会議などを文字起こしし、そこから議事録を制作する場合は以下のポイントを重視して選ぶことをおすすめします。
セキュリティ性
文字起こししたテキストを管理。加工するなどの多機能なサービス
ほとんどの文字起こしサービスはAIが自動で行います。
サービスを提供者はサービスの質向上のため、AIを日々学習させ、文字起こし精度を高めることに注力します。
この努力が逆にセキュリティ的にアウトになることあるので要注意です。
仕事での会議には機密情報が頻繁にでてくるでしょう。
文字起こしサービスによっては文字起こししたデータを蓄積し、サービス向上のため、AIの学習に役立てることがあります。
すると、自社の機密情報を学習してしまい、その情報が漏れてしまう可能性につながりますのでセキュリティを重視する必要がある業務で使用するには見るべきポイントとなります。
そして、文字起こし後のファイルを管理するための機能あるとより便利に使うことが可能となります。
個人の副業
個人の副業で文字起こしを行う場合は、企業から要求される要望に応えることのできる文字起こしサービスを選ぶことがポイントです。
基本的な要望は以下の3つがあり、これらを満たすことのできる文字起こしサービスを選びましょう。
- 素起こし:音声をそのまま文字起こしすること
- ケバ取り:コミュニケーション上、意味を持たない「えー」や「あの…」などの言葉を省くこと
- 整文:話し言葉を書き言葉に直したり、要約する事で見やすい文章に整えること
副業として外注されている時点でっセキュリティー面は厳しく求めることは少ないですので、AIへの再学習などは依頼主から指定がない限り、あまり気にする必要はないでしょう(実際に話し合って決めましょう)
セキュリティなどを重視するとどうしてもコストがかさみます。
もし、youtubeへアップする動画の文字起こしなど、セキュリティに考慮しなくてもよいものならコスト重視で選ぶことがおすすめです。
セキュリティを重視しないといっても、もちろん最低限のセキュリティーや取引先からの指定は担保すべきです。
個人の勉強
文字起こしは個人で使用する場合も多いです。
よく使用するパターンとしては勉強です。
例えば、
- 英語のyotuube動画を翻訳し、勉強する
- 知識系youtuberの動画を文字起こしし、ノートにまとめる
- 講演会の内容を録音し、文字起こしして本にする
- 目標となるお笑い芸人のネタを録音し、文字起こしし、台本の参考にする
- 先輩の営業先でのふるまいを録音し、文字起こしし、営業メソッドを作る
など…
このような場合はパソコンからではなく、スマホから使用する場面が多いですのでスマホ対応しているサービスを選ぶことがポイントです。
費用で選ぶ
費用面はかなり重要な部分ですよね。
webサイトから使用できるオンライン文字起こしサービスは多くありますが、料金形態がバラバラで費用の比較が難しいかもしれません。
そんなときは以下のポイントを抑えるとよいです。
- 初期費用、解約ペナルティをみる
- 月額費用をみる
- 1分当たりの金額を計算する
初期費用、解約ペナルティをみる
企業むけの大規模な文字起こしサービスによく見られますが初期費用と最低契約期間があり、契約期間内に解約してしまうと解約料金が発生してしまうサービスなどがありますます。
高額な分大手企業が運営しており、安心感はありますが解約ペナルティが足かせとなり、解約しにくい状況を生んでしまうかもしれません。
手軽な文字起こしサービスなら初期費用0円、解約ペナルティなしなサービスもありますので、まず試してみたいという方や、個人で使用したい場合はそちらを選ぶとよいです。
月額必要を見る
多くのサービスにも言えることですが、料金形態には多く2つの種類があります。
- 従量課金制
- 月額料金制
従量課金制は使った分だけ料金を請求される仕組みです。
月額料金制は毎月一定の金額を支払い、どれだけ使っても、もしくは、設定された上限までは料金が変わらない仕組みです。
映画でいうとネットフリックはどんだけみても同じ金額である月額料金制であり、映画館や1つづつ購入してみるタイプのものは従量課金制であるといえます。
話をもどすと、文字起こしサービスにも使った分だけ請求される従量課金と、上限までは料金が変わらない月額料金制があります。
それぞれのメリットデメリットは以下になります。
従量課金制
メリット
- 上限なしに使用する事ができるので沢山の文字起こしが可能
- 使わない月は料金が発生しないので、「今月だけ使いたい」という場合に最適
デメリット
- 月額料金制よりも時間当たりのコストが高い
月額料金制
メリット
- 従量課金制よりも時間当たりのコスト安い
- 毎月定期的に使用する場合はコストを抑えることが可能
デメリット
- ほとんどの場合使用できる上限がるので、長時間の文字起こしができない
- 使わない月も料金が発生してしまう
1分当たりの金額を計算する
月額制のサービスでも従量課金制のサービスでも、1分当たりの金額を計算してみると料金の比較がしやすくなります。
たとえば以下のようなAとBのサービスがあった場合、どっちがお得なのでしょうか。
- Aのサービス:月額制。2000円で毎月15時間利用可能
- Bのサービス:従量課金制。1分5円
Aのサービスを1分当たりの金額に直すと2000/900で2.2円となります。
ですので15時間まではAのサービスの方がお得ということになります。
セキュリティの高さで選ぶ
現在のほとんどのwebサービスは最低限のセキュリティを担保していますが、文字起こしなどのAIが絡むサービスは注意する点があります。
それは文字起こししたものが再学習される点です。
再学習に使用されると、他のサービス利用者がAIを使用した際に、情報が洩れてしまう可能性がりますので、再学習されるタイプなのか、されないタイプなのかは絶対に見ておきたいポイントです。
議事録を制作したいので沢山の機能が必要な人におすすめなオンラン文字起こしサイト
Sloos
Sloosは、文字起こしサービスの1つであり、音声ファイルをテキストに変換することができます。以下では、Sloosの特徴、メリット、デメリット、および料金表について説明します。
どんな人におすすめか
Sloosは、インタビュアーやジャーナリスト、ライター、ビジネスプロフェッショナルなど、音声ファイルからテキストに変換する必要がある人に最適です。また、聴覚障がい者のために、音声ファイルをテキストに変換することもできます。
機能の特徴
Sloosには、以下のような機能があります。
- 高度な音声認識技術による高精度な文字起こし
- 多言語対応(英語、スペイン語、フランス語、ドイツ語、イタリア語、日本語など)
- ファイルのアップロードとダウンロード機能
- 長時間の音声ファイルにも対応
これらの機能により、Sloosは、高品質な文字起こしを迅速に行うことができます。
メリット
Sloosの最大のメリットは、高精度な文字起こしを行うことができることです。Sloosは、高度な音声認識技術を使用しているため、テキストの正確性が高く、時間を節約することができます。また、Sloosは、多言語に対応しており、異なる言語の音声ファイルを簡単に変換することができます。
Sloosは、ファイルのアップロードとダウンロード機能を備えているため、音声ファイルを簡単にアップロードして文字起こしを行うことができます。また、長時間の音声ファイルにも対応しているため、大規模なプロジェクトでも使用することができます。
デメリット
Sloosのデメリットは、プランの制限があることです。Sloosの無料プランでは、1日あたり60分までの音声ファイルしか処理できません。有料プランでも、1日あたりの処理時間が制限されています。
また、Sloosは、音声ファイルを自動的に文字起こしするため、正確性に欠ける場合があります。
料金
問い合わせ
AI GIJIROKU
AI GIJIROKUは、人工知能を使って動画や音声を高精度に文字起こしするサービスです。日本語、英語、中国語の3言語に対応しています。
どんな人におすすめか
- セミナーや講演、会議の録音データを文字化したい人
- YouTubeやニコニコ動画などの動画を文字起こしして、視聴に支障がある人にも内容を伝えたいと思う人
- インタビューやラジオ番組の音声をテキストに起こして、文章にまとめたい人
機能の特徴
- 高い精度で文字起こしを行うことができる
- 動画の自動字幕生成機能にも対応している
- 外部ツールとの連携も可能で、APIを提供している
メリット
- 高い精度での文字起こしが可能なため、手作業による修正作業が少なくて済む
- 動画の自動字幕生成にも対応しており、手間が省ける
- API連携が可能で、外部ツールとの組み合わせも容易になる
デメリット
- 料金設定が1分あたり40円とやや高め
- 利用者の登録が必要である
- 長時間の音声データの処理には時間がかかる
料金
- 1分あたり15円から利用が可能(個人利用)
- 月額制で毎月1500円。100分間利用可能
RIMO Voice
RIMO Voiceは、音声を自動で文字起こしするAIツールです。音声の種類を問わず、高い精度で文字起こしを行うことができます。
どんな人におすすめか
- 音声ファイルを手軽に文字起こししたい人
- セミナーや講演、会議の録音データを手早くテキスト化したい人
- 動画コンテンツの字幕作成を効率的に行いたい人
機能の特徴
- 高精度で音声を文字起こしすることができる。
- 音声言語の種類を問わず、日本語、英語、中国語などに対応している。
- 自動で句読点を挿入することができ、読みやすい文章を作成できる。
- 音声の品質に応じて、最適な解析方法を選択することができる。
メリット
- 高精度な文字起こしが可能で、手作業による修正作業が少なく済む。
- 音声言語に対応しており、多言語環境でも利用できる。
- 自動で句読点を挿入することができ、読みやすい文章を作成できる。
デメリット
- 長時間の音声ファイルの処理には時間がかかる。
- 音声データが雑音などで品質が低い場合は、精度が低下する可能性がある。
- 無料版では文字起こしの時間制限がある。
料金について
- 無料版:60分までの無料トライアルが可能
- 有料プラン:音声は1分44円、動画は1分66円
シンプルさとコストを優先したい人におすすめなオンラン文字起こしサイト
S2text.
どんな人におすすめか
- 手軽に文字起こししたい方
- コストを抑えたい方
- 要約をし、議事録を制作したい方
- スマホから文字起こししたい方
機能の特徴
- 500円という低コストで利用可能
- 世界レベルのAIを使用し、高い音声認識を実現
- youtubeやSNSにある動画もリンク1つで文字起こし
- スマホからも扱えるのでパスコンがなくても大丈夫
- AIの再学習なし
メリット
- 他の文字起こしサービスとくらべてコストを極限まで抑えることが可能
- youtubeなどの動画もリンクから文字起こし可能
- テロップ制作や議事録制作で大幅に作業時間を短縮できる
デメリット
- 長時間の文字起こしには向かない
- 大企業で大量の文字起こしをしたり、データを管理する必要がある場合はむかない
- リアルタイム文字起こしや、zoom連携などはできない
料金
- 月額500円で4時間まで利用可能
- 4時間を超えた場合は1分毎に2円
Googleドキュメント
ITの知識が必要になってきますので、敷居は高めです。
どんな人におすすめか
- 講演やセミナーなどの音声を文字に起こしたい人
- 音声ファイルからテキストデータを抽出したい人
- 研究やレポートのためにインタビューの録音を文字起こししたい人
機能の特徴
- 音声ファイルを自動的に文字起こしするため、手作業の時間と労力を大幅に削減できる。
- 言語によっては高い精度で文字起こしができる。
- 文字起こし後のテキストデータは、Googleドキュメント上で直接編集することができる。
メリット
- 手作業の文字起こしに比べて、時間と労力を大幅に削減できる。
- 低コストで利用できる。
- 音声ファイルから抽出したテキストデータは、Googleドキュメントの様々な機能を使って編集や整形ができる。
デメリット
- 精度が必ずしも高くないため、編集や修正が必要な場合がある。
- 言語によっては、文字起こしができない場合がある。
- 大量の音声ファイルを一度に処理することができないため、時間がかかる場合がある。
料金
グーグルクラウドやストレージの容量によって変わってきます。
正確な料金はドキュメントを見るのがよいでしょう。
Watson Speech to Text
ITの知識がある方向けのサービスですので敷居は高めです。
どんな人におすすめか
Watson Speech to Textは、音声データをテキストデータに変換することができるので、以下のような人におすすめです。
- 講演や講義の録音をして、そのテキストデータを作りたい人
- 音声データを使ったアプリやサービスを開発している人
- 読み上げ機能のあるアプリやサービスを利用する人
機能の特徴
- 多言語対応: 30以上の言語に対応しています。
- リアルタイム認識: リアルタイムで音声データをテキストデータに変換することができます。
- カスタマイズ可能: 専門用語など、カスタマイズした単語辞書を作成することができます。
メリット
- 高い精度: IBMの音声認識技術が採用されているため、高い精度で音声データをテキストデータに変換することができます。
- 多言語対応: 30以上の言語に対応しているため、国際的なイベントや会議のテキストデータ作成にも利用できます。
- カスタマイズ可能: 専門用語など、カスタマイズした単語辞書を作成することで、より高い精度で音声データをテキストデータに変換することができます。
デメリット
- 有料: 利用には料金がかかります。詳細は次項に記載します。
- 長時間の音声データには向かない: 大量の音声データを一度に処理することができないため、長時間の音声データには向かないかもしれません。
料金
Watson Speech to Textの料金は、以下の3つのプランが用意されています。
- ライトプラン: フリープランで、月間100分までの音声データの文字起こしを行うことができます。ただし、音声データの長さが1分を超える場合は有料となります。
- 標準プラン: 月間課金制で、1,000分からの音声データの文字起こしが可能です。1分を超える場合は1分ごとに課金されます。
- プロフェッショナルプラン: カスタマイズした単語辞書を使用することができるプランで、1,000分からの音声データの文字起こしが可能です。1分を超える場合は1分ごとに課金されます。
コメント