
Google Whiskの概要
画像生成AI、Google Whiskの特徴と画像生成の仕組み
Google Whiskは、Googleが公開した画像生成AIツールです。これまでの画像生成AIでは文章で指示を出す必要がありましたが、Whiskでは画像を入力として使えるのが特徴です。使い方はとても簡単で、画像を3枚用意します。まず主役にしたい被写体の画像、次に背景にしたい場面の画像、そして最後に完成イメージの雰囲気を決める画像です。これらをマウスで画面上に置くだけで、AIが新しい画像を作り出してくれます。

Whiskは2つの段階で画像を作ります。最初に、Google Geminiという大規模AIが、入力された3枚の画像を見て、それぞれの特徴を文章で説明します。次に、その指示文をGoogleの最新の画像生成AI「Imagen3」に渡して、最終的な画像を作り出します。
このような仕組みにより、Whiskは元の画像をそのまま真似るのではなく、その画像の持つ「本質的な特徴」を理解して、新しい画像を作ります。たとえば、ある人物の写真を使った場合、出来上がった画像では身長が変わっていたり、髪型が違っていたり、肌の色が異なったりすることがあります。これは意図的な設計で、写真を完全に再現するのではなく、ユーザーが自由な発想で新しいものを生み出せるようになっています。
ただし、思った通りの画像にならない場合のために、Whiskには便利な機能があります。Geminiが作った説明文を見たり、編集したりすることができます。この指示文を自分で修正して、もう一度Imagen3に画像を作らせることで、細かい部分を調整できます。このように、Whiskは指示文の作成から画像生成まで、ユーザーが自由に操作できる新しいツールなのです。
Google Whiskは2025年2月からは日本を含む100か国以上で使えるようになりました。一部の機能は英語での利用が推奨されますが、日本のユーザーでも使いやすいように工夫されています。例えば、ガチャガチャの景品やお弁当をテーマにした見本が用意されており、季節の行事に合わせた作例も提供されています。このような日本向けの配慮により、日本のユーザーも直感的に使えるようになっています。
Google Whiskの始め方
Whiskは、Googleアカウントがあれば誰でも無料で利用できます。
以下の手順で利用を開始しましょう。
1. Googleアカウントでログインした状態で、Whiskのウェブサイトにアクセスします。
2. Whiskのホームページには、「クイック作成フォーミュラ」と呼ばれる機能があります。 これは、あらかじめ用意されたテーマ(例:バレンタインのチョコレートボックス)とスタイル(例:カード、ぬいぐるみ)を選択するだけで、簡単に画像を生成できる機能です。
3. より自由に画像を生成したい場合は、「ゼロから作ってみる」をクリックして、新しいプロジェクトを開始します。

Whiskの使い方
Whiskの操作画面は、モデル、背景、スタイルの3つのセクションに分かれています。画像生成は、以下の4つのステップで行います。

- 準備
モデル、背景、スタイルの各セクションに、画像をドラッグアンドドロップ、またはフォルダーからアップロードします。テキストから簡単な参照画像を作成することもできます。 また、「Inspire me」を選択するか、「サイコロ」機能を使用して、Whiskからアイデアの提案を受けることも可能です。これらの素材は、Geminiの視覚理解機能によってキャプション化され、Whiskはこのテキスト記述を使用して画像を生成します。必要に応じて、「編集」をクリックしてキャプションを修正することもできます。 - 探索
素材を選択したら、それらを組み合わせて画像を生成します。Whiskは、選択された素材に基づいて、創造的な画像を提案します。生成された画像を見ながら、さらにアイデアを膨らませることもできます。例えば、「キャラクターにアイスクリームを食べさせる」「恐竜と猫がハイタッチしている」「エナメルピンを丸くする」「パステルカラーの配色にする」といった指示をテキストで追加できます。Geminiは、キャプションと追加の指示を組み合わせて、Imagen3に送信するプロンプトを作成します。「編集」をクリックすると、Imagen3に送信されるプロンプトを確認・編集できます。 - 調整
生成された画像が気に入ったものの、帽子を青色にしたい、背景に夕焼けを追加したいといった場合は、「Refine」モードを使用して、元の画像に近い形で微調整を加えることができます。この際、テキストで指示を出す必要があります。 Geminiは、指示に基づいてプロンプトを更新し、Imagen3は更新されたプロンプトに基づいて画像を再生成します。 - 診断
生成された画像が期待と大きく異なる場合や、要素が欠落している場合は、「Diagnose」モードで、基になるプロンプトを確認・編集することができます。重要な詳細を手動で追加して、Imagen3に再生成を指示することも可能です。

画像生成AIの種類とGoogle whiskの比較
現在、注目を集めている画像生成AIには、OpenAIが開発したDALL-E、Midjourneyという会社の同名製品、そしてStability AIが作ったStable Diffusionなど、いくつかの種類があります。これらの多くは、文章で指示を出すことで画像を作り出します。例えば、OpenAIのDALL-E 3は、私たちが入力した指示文から、とてもリアルで精密な画像を作ることができます。
Midjourneyは、独自の画像生成AIです。特に美しく芸術的な画像が作れることで多くの人に使われています。基本的には文章で指示を出しますが、参考にしたい画像のURLを添えることもでき、複数の画像を組み合わせて新しい画像を作る「blend」という機能も使えます。
Stable Diffusionは2022年に一般公開された、オープンソースのAIです。この使いやすさから、多くのサービスに取り入れられており、日本では例えばLINEの画像生成機能の基礎として使われています。
これらに対して、新しく登場したGoogle Whiskの最大の特徴は、「難しい文章を考える必要がなく、お手本となる画像を見せるだけでよい」という点です。画像を生成するための指示文(プロンプト)が不要ということになります。

DALL-EやMidjourneyでは、理想の画像を得るために試行錯誤しながら詳しい指示文を書く必要がありますが、Whiskは私たちが作りたい画像に近い写真や絵を数枚見せるだけで、AIが自動的に必要な指示文を作ってくれます。つまり、「難しい指示文を省いて、より楽しく使える」ように設計されており、専門的な知識がなくても直感的に使えることが強みです。
最新の画像生成技術であるImagen3を使っているため、作られる画像の品質や表現力も非常に高く、複雑な操作をすることなく、最新のAI技術の恩恵を受けることができます。
ただし、細かい要望を文章で正確に指定したい場合は、従来の文章で指示を出すタイプのAIの方が適している場合もあります。これらのAIは、それぞれ得意分野が異なるので、用途に合わせて使い分けると良いでしょう。
Google Whiskの活用ケース
Google Whiskの活用ケースを見ていきましょう。
活用状況とクリエイティブ分野での利用
Whiskのような画像生成AIは、会社での業務から創作活動まで、さまざまな場面で新しい道具として使われ始めています。Googleが米国のアーティストやクリエイターと行った最初のテストでは、Whiskは「普通の画像編集ソフトとは違う、新しいタイプの創作支援ツール」という評価を受けました。
これは、写真を細かく修正するためのソフトというよりも、自分のアイデアを次々と形にして試せる「発想を助けるツール」として使われているということです。実際に使っているクリエイターからは「細かい部分にこだわりすぎることなく、いろいろな見た目のパターンを簡単に作れる」「思いつかなかったような組み合わせから新しいアイデアが浮かぶ」という感想が寄せられています。Whiskは一度に複数の画像案を作ることができ、その中で気に入ったものだけを選んで保存できるため、短い時間で多くの案を比べられる点が制作現場で重宝されているようです。

具体的な使い方としては、例えばグリーティングカードやポストカードの作成があります。デザインの専門家でなくても、自分で撮った写真をWhiskで加工すれば、オリジナルのカードデザインを簡単に作ることができます。またSNSに投稿する画像を作る時も、伝えたい内容に合う写真や参考画像を入れると、短時間で人目を引く画像ができあがります。さらに高度な使い方では、手書きの簡単な絵をリアルなイラストに変えたり、映画のワンシーンを漫画のような絵に変換したりすることもできます。Whiskには作った画像をステッカーやぬいぐるみのような見た目に変える機能もあり、個人の趣味から仕事まで、アイデア次第でいろいろな使い方ができます。
画像生成AIの活用は年々増えています。米国では雑誌の表紙イラストや広告の画像にAIを使う例が出てきています。例えば広告会社の中には、宣伝企画のイメージ案をMidjourneyやDALL-Eで大量に作り、その中から良さそうな方向性を探るというアイデア出しにAIを活用しているところもあります。ゲーム会社でも、キャラクターデザインの最初の案をAIで複数作り、デザイナーがそこからアイデアを得る、という新しい作り方を試しています。映画・映像の分野では、物語の流れを示す絵コンテ(ストーリーボード)の制作にAI画像を使って効率を上げる取り組みも報告されています。このようなクリエイティブな分野でのAI活用は、「人間の想像力を広げてくれる」手段として前向きに受け止められており、世界中のクリエイターがすでにさまざまな実験を重ねている状況です。
画像生成AIのトレンド
日本市場におけるトレンド
日本においても生成AIへの関心は高まっていますが、一般利用の浸透度合いは諸外国と比べるとまだ限定的というデータもあります。総務省の調査によれば、生成AI(文章・画像問わず)を「使ったことがある」と答えた人の割合は日本では約9.1%にとどまり、中国56.3%、米国46.3%など他国に比べかなり低い水準でした。
一方で認知度は急速に向上しており、2024年時点で日本の一般層でも生成AIという言葉を知っている人は70%以上に上るとの報告もあります。このギャップは「興味はあるがまだ使ったことがない」という層が多いことを示唆しており、今後適切なツールや機会が提供されれば利用者が大きく増える可能性があります。
クリエイティブ分野に目を向けると、日本でもイラストレーターやデザイナーがAI画像生成を制作補助ツールとして試用する事例が出てきています。特にイラスト・漫画の領域では、キャラクターのラフ画を描いた後に背景を生成AIで補完したり、アイデアスケッチ段階でAIにイメージを起こさせたりといった使い方が広まりつつあります。実際、2023年にはAIで描いた背景美術を使った漫画作品が発表され話題となりました。またSNS上でも「#AIイラスト」「#AIアート」といったハッシュタグで多数のAI生成画像が投稿されており、趣味でAI画像を楽しむユーザーコミュニティも形成されています。こうした流れから、日本のコンテンツ制作コミュニティにおいても生成AIは無視できない存在となりつつあります。
一方で、日本企業の間では業務に生成AIを取り入れる動きは慎重ながらも着実に進んでいます。ある調査では、日本企業の17.3%が既に何らかの形で生成AIを業務活用しているとの結果もあり、今後は画像分野でも導入事例が増えてゆくと見込まれます。特に広告・デザイン・ECなどビジュアルコンテンツが重要な業界ほど、競争力強化のためAI活用を模索するニーズが高いと言えるでしょう。今回Google Whiskが日本で提供開始されたことも、市場の潜在需要に応えるタイミングとして適切です。言語の壁などいくつか課題はあるものの、日本語話者でも扱いやすいUIや日本独自テンプレートの用意など、Google側も日本市場を意識した展開を進めています。今後、より日本語での性能が向上しローカルな文脈を理解するモデルが出てくれば、一般ユーザーから企業まで一気に需要が拡大する可能性があります。
法規制やガイドライン(著作権・倫理面)
画像生成AIが広がっていく中で、著作権や倫理面での注意点を理解しておく必要があります。
まず著作権に関して、日本は比較的AI開発に寛容な法整備を行ってきた経緯があります。2018年施行の改正著作権法第30条の4では、「情報解析」(データの解析)のための複製等について包括的な例外規定が設けられました。この規定により、営利目的であっても合法的に入手した既存の画像・文章データをAIの学習用途に利用することが認められると解釈されています。
このような法整備のおかげで、アメリカやヨーロッパでよく見られる「AIの学習データが著作権を侵害している」という裁判が、日本ではあまり起こりません。実際、日本はシンガポールと並んで、AIの学習に関する著作権のルールが世界で最も自由な国として知られています。これはAI産業の発展には良い影響がある一方で、絵や写真を作る人たちからは「自分の作品を勝手にAIに使われたくない」という意見も出ています。そのため、文化庁や経済産業省では2024年に、AIの開発や使用に関する指針やチェックリストを作り、データを使う側と作品を作る側の両方が納得できるような方法を話し合っています。
次に、AIが作り出した画像の権利関係についてですが、これはまだはっきりとした決まりがありません。日本の著作権法では、人間が作ったものだけが著作物として守られます。そのため、AIが自動的に作った画像は厳密には著作物とは認められず、誰でも自由に使えるものとして扱われる可能性があります。しかし実際には、AIが作った画像を使って商品を作ったり、インターネットで公開したりする人も出てきているため、業界の団体が独自のルールを考えている最中です。
また、有名人の写真をAIに学習させて似顔絵を作り、それを商売に使うと肖像権の侵害になる可能性があります。同様に、人気キャラクターに似たイラストをAIで作ってグッズを売ると、権利を持っている会社から苦情が来るかもしれません。
さらに、差別的な内容や暴力的な画像、偽の情報を含む画像をAIで作ることをどうやって防ぐかという問題もあります。GoogleのWhiskなど大手企業のサービスでは、そういった危険な画像を作れないような対策が組み込まれています。ただし、誰でも自由に使えるAIの場合は、使う人のモラル次第という部分が大きいため、社会全体でAIの正しい使い方を学び、ルールがつくられていく過渡期と言えるでしょう。
画像生成AIのマーケティング分野での活用
画像生成AIは、広告やマーケティングの世界に大きな変化をもたらしています。例えば、デザイナーが今まで何日もかけて作成していた広告バナーやSNS用の画像を、生成AIを使えば数分で大量に作ることができるようになりました。
実際、LINEヤフー株式会社は2025年に、Yahoo!広告において1枚の画像から様々なサイズの広告画像を自動的に作り出すAI機能を導入しました。この機能により、デザイナーがいない会社でも簡単に異なるサイズの広告バナーを作れるようになり、広告制作の手間が大幅に減ったと言われています。広告主は誰でもこの機能を無料で使うことができ、1つのアカウントで1ヶ月に30回まで利用できます。このおかげで、広告制作にかかる時間とお金を節約でき、マーケティング担当者が自分で広告デザインを試してみることができるようになっています。
さらに、広告の中身自体を生成AIが作るという例も出てきました。伊藤園のテレビCMでは、実在しない人物をAIで作り出して出演させました。これは、今までモデル事務所に依頼していた人選をAIで行う新しい試みでした。このCMは商品の宣伝以上に「本物のモデルではない人物が商品の顔になる」という点で大きな話題を呼びました。
海外では、ファッションブランドが新しいコレクションの宣伝写真をAIで作り、インターネット広告に使用しています。これにより、様々な人種や年齢のモデル写真を安く準備でき、世界中での宣伝活動に活用できたそうです。例えば、ナイキが試験的な広告キャンペーンでこの方法を使っています。
商品のパッケージデザインでも、AIが考え出した新しいデザインを取り入れ始めています。日本のある古くからある菓子メーカーは、AIが提案したパッケージデザインを期間限定商品に使用し、今までにない斬新なデザインで消費者の興味を引くことができました。
広告会社も、自社のデザイナーとAIを組み合わせた仕事の方法を研究しています。特に、たくさんの種類を作って効果を比べる必要があるバナー広告やSNS用の動画広告の分野では、AIを使うメリットが大きいと考えられています。
Google Whiskを活用してみよう
Google WhiskはITやAIに詳しくない一般の人でも、簡単に画像を生成することができるツールとして期待されます。新しい生成AIを試してみてはいかがでしょうか。