Gemini AI Studioの画面共有機能を解説!動画でマニュアル自動生成&LPレビューも
最終更新日:
2025.10.14

監修者情報

岡田 徹
NOVEL株式会社 代表取締役
大阪大学在学中よりエンジニアとして活動し、複数のプロダクト立ち上げを経験。
2019年2月にNOVEL株式会社を設立。
2022年より生成AI領域に特化し、
AIライティングSaaS『SAKUBUN』(累計70万回利用・2万アカウント)を企画・開発。大手メディアや人材企業・出版企業への導入実績を持つ。
現在は中堅企業向けAIコンサルティングに注力し、製造業・小売業・金融機関など業種を問わず、生成AIの導入から定着までを一気通貫で支援している。
著書: 『2冊目に学ぶ ChatGPTプロンプト攻略術』(C&R研究所、2024年)
この記事に関連するお役立ち資料

AIを活用した業務自動化 事例BOOK
無料ダウンロード
これまで多大な時間と労力を要していた、操作マニュアルの作成、議事録の文字起こし、WebサイトやLPのレビューといった業務。これらの非効率な作業が、AIによって劇的に変わろうとしています。
その中心にいるのが、Googleが開発した最新AIモデル「Gemini 2.5 Pro」です。本記事では、このGeminiをブラウザ上で手軽に試せる「Gemini AI Studio」を活用し、実際のビジネスシーンでどのように役立つのかを、弊社代表の岡田とエンジニアの秋月による対談形式で徹底解説します。
これまでのAIがテキストや静止画を主戦場としてきたのに対し、GoogleのGemini 2.5 Proは「動画」という時間軸を持つ複雑な情報を、いとも簡単に処理してしまいます。その能力は、私たちの想像を遥かに超えるレベルに達しており、ビジネスのあり方を根底から覆すほどのインパクトを秘めています。
岡田: 今日試したいのが、Gemini AI Studioに追加された「カメラ」という新機能です。コンソールからPC画面の操作などをレコーディングできるんですが、これがマニュアル作成に使えるんじゃないかと思っていて。

秋月: ほうほう、画面録画をAIが処理してくれるんですね。
岡田: そうなんです。例えば、社内システムの操作手順書を作るとします。まず、レコーディングを開始して、実際にシステムを操作するんです。「スタジオから新規作成を押して、ワークフローを選択して…」といった一連の流れを録画します。


岡田: そして録画を停止すると、その動画をプロンプトとしてAIに与えることができます。今回は「Gemini 2.5 Pro」を使ってみます。…はい、見てください。こんな感じで手順書が生成されました。
秋月: すげえー!しかも、最初のほうで岡田さんが操作を間違えたり、関係ない画面を見たりしていた無駄な動作が綺麗に省かれていますね。
岡田: えぐいでしょ?本当に必要な操作だけを的確に抜き出して、テキスト化してくれるんです。これまでスクリーンショットを何枚も撮って、説明文を書いて…とやっていた作業が、動画を撮るだけでほぼ完了してしまう。これは衝撃的ですよ。

岡田: この動画認識能力は、単純な操作記録だけにとどまりません。いわば「動画版OCR」とも言えるレベルで、映像内の文字情報を正確に読み取ることができます。試しに、技術書のページを数ページ、動画でパラパラとめくるように撮影してみました。

秋月: なるほど。それをAIに読み込ませて、内容を理解できるか試すわけですね。でも、動画だとトークンの消費が激しいのでは?
岡田: それが面白いところで、実際にやってみたら1分弱の動画で消費したのはたったの263トークン。音声も32トークンと、驚くほど少ない。Gemini 2.5 Proは最大100万トークンまで対応できるので、計算上は1時間近い動画でも丸ごと処理できることになります。
入力タイプ | 時間/量 | トークン数(参考) |
|---|---|---|
動画 | 約1分 | 約260 |
最大コンテキスト | - | 100万トークン(約1時間の動画に相当) |
岡田: そして、この動画を基に「このテキスト内容に関する問題を難易度別に5問作って」と指示して、その問題をGemini自身に解かせてみたんです。一番難しい問題の答えも…ほら、完璧に合ってる。

秋月: バケモンやんけ!動画を流し見しただけで、内容を完全に理解して質疑応答までこなしてしまうとは…。
岡田: しかも「中央に抽象的でカラフルな画像」みたいな、テキスト以外の情報まで正確に認識している。もはや人間の読解能力を超えているかもしれません。
この驚異的な動画認識能力は、より実践的なビジネスシーン、例えばマーケティング領域でも活用できます。ここでは、Webサイトのランディングページ(LP)を改善するシナリオを想定し、Geminiの活用法を探ってみましょう。
岡田: マニュアル作成と同じ要領で、今度は改善したいLPを上から下までスクロールする様子を画面録画します。この動画をGeminiにインプットして、「このLPの改善案を提案してください」と指示してみます。

岡田: すると、デザイン、キャッチコピー、CTA(Call To Action)の配置など、多角的な視点から具体的な改善案リストが生成されます。人間が見落としがちな「全体の一貫性」や「情報の流れ」といった抽象的な部分まで指摘してくれるのがすごいところです。
秋月: これは強力ですね。Webディレクターやコンサルタントの壁打ち相手として、非常に優秀なアシスタントになりそうです。
Gemini 2.5 Proが見せつけた圧倒的な性能は、単なる「便利なツール」の登場を意味するのではありません。これは、システム開発の常識そのものを覆すゲームチェンジャーです。「AI開発は高価で時間がかかる」という時代は終わりを告げ、いかに既存の優れたAIを「賢く、自社に合わせて使いこなすか」が成功の鍵となります。この変化は、システム導入を検討する貴社にとって、何を意味するのでしょうか。
岡田: システム開発をご検討中のお客様から、「AIを自社ビジネスに導入したいが、開発のハードルやコストが心配だ」というお話を非常によく伺います。しかし、GeminiのようなAIが登場した今、その心配はもはや過去のものです。
秋月: これまでは、例えば「画像から文字を読み取るOCRシステム」を導入しようとすると、AIベンダーがそのためのAIエンジンをゼロから研究・開発する必要がありました。当然、莫大な開発期間とコストがかかっていましたね。
岡田: その通りです。しかし、状況は一変しました。今は、Googleが開発した世界最高峰のAIエンジンを、いわば「既製品の高性能パーツ」として、比較的安価に利用できるようになったのです。かつてGoogle Mapsという地図の「パーツ」が登場したことで、UberやAirbnbのような革新的なサービスが生まれたのと同じことが、AIの世界で起きています。
秋月: つまり、高価なエンジン開発に予算を割く必要がなくなった分、お客様の独自の業務フローや課題解決に特化した「システム本体」の設計・カスタマイズに、リソースを集中できるということですね。
岡田: まさに。私たちがご提案するのは、「AIをゼロから作る」ことではありません。Geminiという最高のエンジンと、貴社が培ってきた業務ノウハウやデータを組み合わせ、貴社のためだけの専用システムを、従来よりもはるかに短期間・低コストで構築すること。それが、今の時代における最も賢明なシステム開発の進め方です。

岡田: では、開発パートナーをどう選べばいいのか?という次の問いが生まれます。これまでの選定基準は「どれだけ高度なAIを自前で開発できるか」という純粋な『技術力』でした。しかし、誰もが同じ高性能エンジンを使える今、その基準はもはや意味を成しません。
秋月: 本当に問われるのは、「その高性能エンジンを使って、お客様のビジネス課題をいかに的確に解決できるか」という『課題解決力』ですね。
岡田: はい。どんなに優れたAIも、貴社の現場にある具体的な課題、例えば「この帳票の、この部分の読み取り精度を上げたい」「この動画の、この瞬間の異常を検知したい」といった、泥臭くも重要なニーズを深く理解していなければ、全く役に立たない『宝の持ち腐れ』になってしまいます。
秋月: 技術論を振りかざすのではなく、お客様の業務にどれだけ寄り添い、AIを「翻訳」して現場で使える形に落とし込めるかが、ベンダーの真価ですね。
岡田: 特に、これまでIT化が十分に進んでこなかった物流、建設、介護、製造といった業界には、AIで効率化できる業務が無限に眠っています。私たちは、ただシステムを作る会社ではありません。貴社の業界特有の課題や商習慣を徹底的にヒアリングし、現場の皆様が本当に「このシステムがあって良かった、仕事が楽になった」と実感できるソリューションを設計・開発すること。それこそが、私たちが提供する最大の価値であり、これからのベンダー選びにおける最も重要な視点だと考えています。
本記事では、Googleの最新AI「Gemini 1.5 Pro」が持つ驚異的な動画認識能力と、それを活用した具体的なビジネス応用例を、対談形式でご紹介しました。
画面操作の録画だけで、高精度なマニュアルを自動生成
動画内のテキストや状況を完璧に理解し、質疑応答まで可能
LPのレビューや改善案の提案といったクリエイティブな作業も支援
これらの事実は、AIがもはや単なる補助ツールではなく、ビジネスの中核を担うパートナーへと進化していることを示しています。
「AIエージェントで定型業務を効率化したい」
「社内に眠る膨大なデータをビジネスに活かしたい」
「本記事で紹介されたような動画解析を自社の業務に応用したい」
このような課題をお持ちではありませんか?
私たちは、お客様一人ひとりの状況を丁寧にヒアリングし、本記事でご紹介したような最新のAI技術を活用して、ビジネスを加速させるための最適なご提案をいたします。
AI戦略の策定から、具体的なシステム開発・導入、運用サポートまで、一気通貫でお任せください。
「何から始めれば良いかわからない」という段階でも全く問題ありません。 まずは貴社の状況を、お気軽にお聞かせください。
Q1: 今回紹介された動画の文字起こしやマニュアル作成は、どのくらいの長さの動画まで対応できますか?
A1: Gemini 2.5 Proは最大100万トークンのコンテキストウィンドウを持っており、これは約1時間の動画に相当します。対談内での検証では、1分程度の動画は数百トークン程度しか消費しなかったため、一般的な業務マニュアル作成や議事録作成などには十分すぎる性能と言えます。
Q2: AIが生成したマニュアルやレビューの精度は信頼できますか?
A2: Gemini 2.5 Proの精度は非常に高いですが、100%完璧ではありません。特に専門的な内容や固有名詞については、誤りが含まれる可能性があります。AIが生成したアウトプットはあくまで「ドラフト(下書き)」と捉え、最終的には人間の目で確認・修正するプロセスを組み込むことが重要です。
Q3: 専門的な業界の動画でも内容を理解してくれますか?
A3: はい、Geminiは膨大なデータで学習しているため、多くの専門分野に対応可能です。しかし、より精度を高めるためには、業界の専門用語などをプロンプトに含めて補足説明するなどの工夫(プロンプトエンジニアリング)が有効です。弊社では、そうした業界特化のAI活用コンサルティングやシステム開発もご支援しておりますので、お気軽にご相談ください。
Gemini AI Studio: Googleが提供する、生成AIモデル「Gemini」をブラウザ上で手軽に試せる開発者向けツール。プロトタイピングに最適。
Gemini 2.5 Pro: Googleが開発した最新のマルチモーダルAIモデル。特に長文・長時間の動画や音声を一度に処理できる「100万トークン」のコンテキストウィンドウが特徴。
最後までお読みいただき、ありがとうございます。
NOVEL株式会社では、生成AIを活用して企業の業務改善や新規プロダクト開発を支援しています。
私たちは「現場に眠るデータをつなぎ人とAIが協働する社会を創る」というビジョンのもと、非IT業界が抱える複雑な課題に日々向き合っています。
もしあなたが、
新しい技術の可能性にワクワクする方
困難な課題解決を楽しめる方
自分の手で「0から1」を創り出す経験をしたい方
であれば、私たちのチームで大きなやりがいを感じていただけるはずです。 まずは、私たちがどんな未来を描いているのか、採用ページで少し覗いてみませんか?
この記事に関連するお役立ち資料を無料ダウンロード

AIを活用した業務自動化 事例BOOK
AI技術を活用した社内業務効率化の基本から、実際の導入ステップまでをわかりやすく解説しています。
下記フォームにご記入下さい。(30秒)
テックユニットは、下記のような方におすすめできるサービスです。
お気軽にご相談ください。
・開発リソースの確保に困っている方
・企業の新規事業ご担当者様
・保守運用を移管したい方
・開発の引き継ぎを依頼したい方


おすすめの記事
関連する記事はこちら
OCRを導入したのに工数が変わらない理由──「一気通貫で自動化しないと意味ない」と断言できる根拠
OCRを導入して読み取りはできるのに、その後のExcel貼り付けや確認作業は人のまま。「一気通貫で自動化しないと全体工数は変わらない」という構造的な理由と、例外処理・辞書の育て方・ROIの出し方を解説します。この記事でわかること「読み取り部...
「3年前に試して無理だった書類」が今は99.9%で読み取れる──生成AIベースOCRが変えた精度の常識
3〜5年前に諦めたOCRを再度試したら99.9%の性能が出た、という現場が増えています。生成AIベースOCR(VLM)が旧来OCRと何が違うのか。精度99%の実態と、図面・手書き書類への対応力の変化を解説します。 この記事でわかる...
使うのは全体の3割だけ──ChatGPTが社内に定着しない「2つの壁」
大企業でも全社導入後に使っているのは2〜3割にとどまる背景と、社内に定着しない「2つの壁」、そして企業によって定着しやすさに差が出る理由を解説します。この記事で分かること・ChatGPTは3000人規模の大企業でも、全社導入後に使っているの...
「提案は立派なのに何も変わらない」を防ぐーー1問で分かるAI導入コンサルの本当の見極め方
AI導入コンサル選びの失敗パターン3つと、面談で使える見極め方を実務経験から解説。「論点整理だけ」「開発はできるがコンサルはできない」など現場で起きる地雷の正体とは?この記事でわかること-AI導入コンサル選びの失敗は「提案の華やかさ」で選ぶ...
AI外注 vs 内製 どっちが正解?3年やって出た答えは"どっちもコケる"
AI外注か内製かで悩む中小企業向けに、どちらを選んでもコケる理由と、成果が出るハイブリッドの分業モデルを実務経験から解説します。この記事でわかること- フル外注もフル内製も、どちらを選んでも失敗しやすい構造的な理由がある- AI導入の失敗は...
そのデータ、本当にAIに使えますか?活用前に整理したい2つのこと
「AIを使いたいけど、うちのデータって本当に使えるのかな……?」そんな不安を感じている企業は少なくありません。ChatGPTなどの生成AIを導入しても、社内データの状態が整っていなければ、期待した答えが返ってこないことはよくあります。そこで...
Excel・Accessがもう限界?移行を判断する10のサインと、中小企業の現実的な進め方
ある日突然、業務が止まる前に「受注管理のExcelを2人で同時に開いたら壊れた。バックアップがなく、1週間分のデータが消えた。」「Accessのデータベース、作った担当者が退職してから誰も触れていない。クラッシュしたら終わり。」「月末の集計...
AI時代に必要なデータ基盤とは?整理しないとAIは使えない
「AIを入れたのに使えない」の本当の原因「ChatGPTを社内に導入したけど、精度が出なくて結局使われていない」「AIで月次レポートを自動化したいのに、どこから手をつければいいかわからない」こうした声は、AI導入を検討している中小企業のあち...
DX推進室がなくても大丈夫!現場主導のAI活用スモールスタート術
「AIの導入は、専門のDX推進室や優秀なAIエンジニアがいる大企業だけの話だ」 「我が社には推進できる人材がいないから…」企業の規模を問わず、多くのビジネスリーダーがAIの可能性を感じながらも、人材不足を理由に最初の一歩を踏み出せずにいます...
AIで営業の優先度付けを自動化|売れる3%に集中する方法
「なぜ、あの人だけが常に高い成果を上げ続けるのか?」 多くの営業組織では、一握りのトップセールスが全体の売上の大半を支えるという、いわゆる「属人化」が長年の課題となっています。彼らの持つ勘や経験を組織に共有するのは難しく、多くの営業担当者は...
方法から入るAI導入は失敗する|現場起点のAI定着設計術
「最新のAIツールを導入したが、現場では全く使われず、ライセンス費用だけが無駄になっている…」 これは、AI導入に取り組む多くの企業が直面する、決して珍しくない現実です。鳴り物入りで始まったプロジェクトが、なぜ現場に受け入れられず、静かに形...
AIは指示待ちから先回りへ。次世代AIエージェントとは
これまで私たちが慣れ親しんできたChatGPTをはじめとする生成AIは、非常に賢いアシスタントでした。しかし、その基本はあくまで「指示待ち」。ユーザーがプロンプトを入力して初めて、その能力を発揮する受動的な存在でした。しかし今、その常識が大...
人気記事ランキング
おすすめ記事