企業内に眠るデータの約8割は、Excelのセルやデータベースにきれいに格納された「構造化データ」ではなく、議事録やメール、画像、音声といった形式の定まっていない「非構造化データ」であると言われています。これらの「汚いデータ」は、これまで活用が困難とされてきました。しかし今、マルチモーダルAI(※3)の進化が、この状況を一変させようとしています。今回は、非構造化データをビジネスの「宝」に変えるAI技術の最前線について、代表の岡田とエンジニアの秋月が語り合います。岡田(代表): 企業の現場には、営業担当者が手入力したCRMのメモや、紙の帳票、商談の録音データなど、形式の定まっていない非構造化データが本当に溢れていますよね。「氏名」の欄に会社名まで入っていたり、電話番号にハイフンがあったりなかったり…(笑)。人間の手入力に頼っている限り、データの汚れは避けられません。しかし最近、この状況を打破する技術の進化を肌で感じています。先日、約30枚の帳票をAIで読み取らせる機会があったのですが、驚くべきことに、読み取りのミスは1つもありませんでした。秋月(エンジニア): 読み取り率100%はすごいですね。岡田(代表): 最初から完璧だったわけではなく、実はプロンプトの工夫が鍵でした。最初の単純な指示では、いくつかの項目で歯抜けが発生したんです。そこで、「この帳票はこういう構造になっているから、この項目はここから読み取ってほしい」といった具合に、AIに対する指示、つまりプロンプトを非常にリッチなものに書き換えたところ、精度が劇的に向上しました。マルチモーダルAIの画像認識能力は、もはや人間を超えるレベルに達していると断言できます。秋月(エンジニア): まさにAIのポテンシャルを引き出す「プロンプトエンジニアリング」の実践例ですね。技術的な話をすると、最近では、CLIP(※4)のような外部の画像認識モデルを使わずに、言語モデル単体で高精度の画像認識を実現したという論文も出てきています。これは、言語を処理するAIが持つ「推論能力」が、未知の画像パターンを文脈から理解する上で重要な役割を果たしていることを示唆しており、非常に興味深い動きです。岡田(代表): Googleが開発を進めている「世界モデル」にも通じる話かもしれませんね。彼らは、テキスト情報だけでなく、マシュマロの上に鉄アレイを置いたら潰れるといった物理的な世界の感覚値までAIに学習させようとしています。こうした進化により、商談動画や音声といった、これまで活用が難しかったデータから、要点や決定事項といった構造化された情報を自動で抜き出すことが、ごく当たり前のことになるでしょう。秋月(エンジニア): 営業担当者が商談後に1時間かけていたCRMへの入力作業がゼロになるインパクトは計り知れません。その時間を、お客様との関係構築という、より創造的な活動に使えるようになりますから。ただ、岡田さんが以前指摘していたように、既存のCRMをすべてAIベースの新しいものにリプレイスするのは、企業にとってはかなりハードルが高いですよね。岡田(代表): ええ、長年蓄積してきたデータを移行するリスクや、全従業員が新しいツールを習得するコストを考えると、現実的ではありません。だからこそ、「リプレイス(置き換え)」ではなく「アドオン(付け足し)」という考え方が重要になります。既存のCRMはそのままに、人間では不可能だった業務や、面倒で後回しにされがちだった業務をAIで補うんです。秋月(エンジニア): 具体的にはどのような「付け足し」が考えられますか?岡田(代表): 例えば、商談が終わった瞬間に、その録音データを基にAIがお礼メールの文案を自動で作成し、担当者の確認一つで送信できる。あるいは、顧客の過去のやり取りやWebサイトのIR情報をAIが読み込み、次の商談で有効な「アイスブレイクのテーマ」を提案してくれる、といった使い方です。これらは、営業の属人性に頼っていた部分をAIで標準化し、全体の質を底上げすることに繋がります。秋月(エンジニア): まさに痒い所に手が届く機能ですね。その鍵となる音声認識の精度も飛躍的に向上していますよね。岡田(代表): はい。最近、ElevenLabs(※5)という音声AIを試して驚愕したのですが、特別な機材は不要で、iPhoneのボイスメモで録音した音声をアップロードするだけで、ほぼ完璧に文字起こししてくれるんです。以前試した専用の録音デバイスは、アップロードに時間がかかるなどの手間がありましたが、今やスマホ一つで十分。この高精度なテキストデータをGPTのような言語モデルに渡せば、とんでもなく質の高い議事録が瞬時に完成します。秋月(エンジニア): 非構造化データをAIで「綺麗な構造化データ」に変換し、データベースに格納する。この一連の流れが自動化されることで、これまで埋もれていたデータが真の価値を持ち始めますね。企業の競争力は、今後いかにAIを活用して非構造化データを資産に変えていけるかにかかっている。そう言っても過言ではないでしょう。(※3) マルチモーダルAI:テキスト、画像、音声など、複数の種類の情報を同時に処理できるAI。(※4) CLIP (Contrastive Language-Image Pre-Training):テキストと画像の関連性を学習するAIモデル。(※5) ElevenLabs:高精度な音声合成や音声認識を提供するAIプラットフォーム。その業務課題、AIで解決できるかもしれません「AIエージェントで定型業務を効率化したい」 「社内に眠る膨大なデータをビジネスに活かしたい」このような課題をお持ちではありませんか?私たちは、お客様一人ひとりの状況を丁寧にヒアリングし、本記事でご紹介したような最新のAI技術を活用して、ビジネスを加速させるための最適なご提案をいたします。AI戦略の策定から、具体的なシステム開発・導入、運用サポートまで、一気通貫でお任せください。「何から始めれば良いかわからない」という段階でも全く問題ありません。 まずは貴社の状況を、お気軽にお聞かせください。>> AI開発・コンサルティングの無料相談はこちら