“地味に面倒” な文字起こしの手間を 1/5 に大幅削減した音声テキスト化サービス – 株式会社メディアドゥ「Smart書記」
会議や講演、記者発表など、録音した音声を文書化したいという場面はあらゆるビジネスシーンで多く存在します。しかし、音声データの文字起こしは一般的に「録音時間の 5 倍かかる」と言われる、時間と手間のかかる作業です。何度も巻き戻しては聞き直し、テキスト化していく文字起こしに、人手や時間を割かざるを得ないケースも多いのではないでしょうか。
このような課題を解決するため、徳島県庁では「徳島発! AI 要約サービス」に株式会社メディアドゥによって開発、提供された音声自動文字起こしサービス「Smart書記」を採用し、2018 年 10 月より本格運用を開始しました。これにより徳島県では議事録作成にかかる時間が 1/5 まで削減され、県民に向けた定例記者会見のテキスト公開までにかかる日数も大幅な短縮を実現しました。
テープ起こしと文書化にかかる膨大な作業時間が課題
多くの自治体では、定例記者会見の会見録を文書にして Web サイトに公開しています。これは施策内容や事業活動を広く住民に知らせたり、生活に重大な影響を及ぼす恐れのある事故や災害の情報を知らせたりするもので、正確で迅速、かつ効率的な運用が求められます。
しかし、口頭で話した内容をテキストに起こすのには多大な労力と時間を要してしまうものです。文書として完成するまでには、耳で聞き、文字に起こし、文章として整え、全体としてまとめるという一連の作業が必要ですが、いわゆる “テープ起こし” の作業だけでもかなりの時間がかかってしまいます。会議の議事録を文書化したいというニーズは高いものの、手間がかかるために諦めているケースも多く見られます。
株式会社メディアドゥの榊原氏は、開発の背景について「テキストの活用まで」がポイントだと語ります。
榊原氏: 音声のテキスト化に対するニーズは新しいものではありません。しかし実際に数千~数万文字というテキストを起こしても、それをなかなか活用できないという課題がありました。要望はありながら、テキストの活用までを一連で提供するサービスがなかったために、文字起こしサービスもあまり普及してこなかった、という面があると考えています。
徳島県ではこれまで、知事の定例記者会見内容の Web 公開は会見から 4 日後だったとのことです。会見録の作成も複数名で残業をしてあたるなど、リソースがかかり、県民に情報が届くまでに時間を要していました。そこで、株式会社メディアドゥ (以下 メディアドゥ) の「Smart書記」を活用した課題解決に着手しました。
まず、徳島県とメディアドゥは、2017 年10 月から半年間、徳島県において本サービスの実証実験を実施。本サービスの導入により議事録作成にかかる作業時間を大幅に短縮できることが確認できました。県民は、県が公表する文書をよりタイムリーに閲覧できるようになり、さらに公開された文書を任意の条件で瞬時に要約する機能の利用も可能になりました。
県民の 9 割以上の好意的な反応もあり、2018 年 10 月より本格運用の開始に至ったのです。
言葉とは成長していくもの ~クラウドの音声認識技術を採用した理由
マイクが拾った音声を AI が瞬時に文字化する「音声自動文字起こし」機能は、高い認識率を誇ります。音声認識と翻訳機能には Microsoft Azure の Cognitive Service を利用しており、音声認識機能 API の一つである “Speech Translator API” を活用した「マルチリンガル機能」では、日→英、英→日のような相互翻訳や、英⇔中など、現在 10 言語※ での外国語同士のリアルタイム翻訳が可能です。Microsoft Azure のような、クラウドの音声認識技術を使っているということが精度向上の一つのポイントだと榊原氏は説明します。
※ 2019 年 3 月現在の対応言語数
榊原氏: 言葉というものは成長していくものです。トレンドのワードがあったり、各業界のクセがあったりするため、事前の辞書や学習だけでは対応できない部分があります。クラウドの技術であれば、日々ディープラーニングが繰り返されています。膨大な学習データを文脈の理解の部分に利用することで、高い認識率が実現できています。
また、同社営業課の室井 美保氏によると、「Smart書記」の最大の特徴は、即時編集が可能な点にあります。編集画面は、発言者や発言単位ごとに区別して文字化されるなど、編集しやすいインターフェイスになっています。複数人による会議では、発言者ごとに色分けされ時系列に発言が表示されます。発話ごとに音声を確認することもできるため、テープ起こしの際によくある「頭まで巻き戻して聞き直す」という時間と手間が不要になるのです。さらに、同時編集が可能なため、収録中に誤字や気になるところをマークしておき、収録後にその部分だけを聞き直して修正することも可能です。これらは同製品の大きな強みであり、業務効率化に大きく貢献している部分でもあります。
室井氏: 「Smart書記」はクラウド提供され、ユーザーはどこからでも接続できます。会議室の外にいながら、複数人が同時に編集をおこなうことで、よりスピーディーな文書化が可能になります。在宅ワーカーが編集作業を自宅でおこなうこともでき、働き方改革実現の一助にもなると注目が集まっています。
開発当初は不自然な日本語になることもありましたが、長い発言には「。」(句点) を入れるなどの工夫で分かりやすい表現になるよう、改善を重ねました。
室井氏: PC の環境によっても違いが出てきますので、ソフト面だけではなくハード面についても改善を進めています。
AI を利用して既存の文章を任意の条件で瞬時に要約する「AI 要約」機能は、ユーザーが文字量を設定 (10% ~ 90% など) すると、その分量で対象の文章を AI が要約するものです。これは要件に応じて開発する拡張機能です。長い文章は読み手にとって負担になりがちですが、この機能があれば任意の粒度で、自動でサマライズが可能になります。
10 時間かかっていた作業を 2 時間に短縮
徳島県の実験では、今までは約 10 時間かかっていた県職員による会見録作成が、本サービスの活用により約 2 時間にまで短縮されるという結果が出ました。知事が定例記者会見で発言したテキスト情報についても、これまでは会見 4 日後だった Web 公開を、当日のうちに公表できるようになるなど、情報発信の強化を実現しています。
要約機能は県民との距離を縮めるのにも役立っています。徳島県はいくつかの定例会見録を AI 要約の対象とし、専用の AI 要約サイトで公開しました。AI 要約利用者アンケート調査では、「いろんな知識が身につきやすく、興味を持ちやすくなる」また「理解が深まる」といった声が上がり、9 割を超える利用満足度を得ました。記者会見、関連ページのアクセス数も従来の約 2.2 倍に増加しています。
大幅な作業時間の短縮が可能になる上に、迅速かつ利便性の高い情報共有で住民サービスの向上にもつながる「Smart書記」について、働き方改革などを背景に、多くの企業や自治体からの問い合わせが増えています。
利用範囲を拡大し本格展開へ。AI 活用で取り組む働き方改革と新価値創出
徳島県では、記者会見録を皮切りにスタートした本サービスを、県のすべての審議会や協議会の議事録にも対象を拡大して実装、本格展開に乗り出しました。今後も AI をはじめとする最先端技術を、行政事務の分野において活用し、職員の働き方改革の推進、また新たなサービスの創出に取り組むとしています。
メディアドゥでは、この「Smart書記」を総合行政ネットワーク (LGWAN) のネットワーク内でも利用できるよう、年度内の提供を目指し対応を進めています。この対策が完了すれば、記者発表などのパブリックな情報だけでなく、LGWAN のネットワーク内で取り扱う、内部の議事録などにも利用が可能になり、利用範囲が大きく広がります。
行政の各セクターにおける利用拡大に向けて、都度対応しながら開発を進めていく見通しです。今後も時代とともに変化する働き方やビジネス環境、そしてユーザーのニーズに合わせたサービスを開発、提案していくとのことです。
株式会社メディアドゥ
- 本社: 〒100-0003 東京都千代田区一ツ橋 1-1-1 パレスサイドビル 5F
- 設立: 2012 年 4 月 2 日
- 事業: デジタルコンテンツ流通・配信/システム開発・提供/インターネット広告取り扱い/メディアコンサルティング/出版者支援サービス
ひとつでも多くのコンテンツを、ひとりでも多くの人へ。
メディアドゥは大手出版社をはじめ、数百社のコンテンツを取り次ぐ「電子書籍取次」として、コミックをはじめ文芸書やビジネス書、専門書、写真集から雑誌にいたるまで幅広いジャンルを取り揃えています。さらに、配信システムの提供から電子書籍販売に関するコンサルティングや電子図書館の推進など、電子書籍に関する様々なソリューションを提供しています。
※本情報の内容 (添付文書、リンク先などを含む)は、作成日時点でのものであり、予告なく変更される場合があります。