Geminiの使い方を、2026年最新版で初心者向けに整理した。GoogleのAIアシスタントGeminiには「ブラウザで使うWeb版」「自分のアプリに組み込むAPI」「コーディング活用」という3つの入口があり、本記事はその全体像を、公式の一次情報をもとに一本の地図として示す。
GeminiはもはやチャットUIだけのサービスではない。画像・音声・動画を扱うマルチモーダル、100万トークンの長文脈、Gmailやドキュメントと連携するWorkspace統合まで広がっている。無料で試す段階から業務導入までを通しで解説する。
AIアシスタント・エージェントの全体像は AIエージェントとは?仕組み・種類・代表的OSSフレームワークを初心者向けに解説 をご覧ください。
30秒で理解するGeminiの使い方
まず要点だけ先に押さえる。細部はこのあとのセクションで順に掘り下げる。
・Geminiは、Googleが提供するマルチモーダルAIアシスタント。Web版(gemini.google.com)・API(Google AI Studio)・コーディング活用の3つの入口がある
・無料プランでもGemini 3.5 Flash・Deep Research・画像生成・Canvas・15GBストレージが使え、日常用途なら十分回る
・有料はGoogle AI Plus(¥1,200)/ Pro(¥2,900)/ Ultra(¥14,500〜) の3段で、上位モデルと動画生成、ストレージが増える
・APIはGoogle AI Studioで無料のAPIキーを発行し、google-genai SDKから数行で呼べる
・2026年の主力はGemini 3.5 Flash(1Mトークン文脈・高速) と、難しい推論向けのPro / Deep Think
- 「Web版・API・コーディング」の3入口を区別するのが、2026年のGeminiの使い方を理解する出発点
- 無料プランの守備範囲が広い。まず無料で試し、上位モデル・動画生成・ストレージが必要になった段階で有料へ
- 最大の差別化はGoogle Workspace連携と1Mトークンの長文脈。自分のメール・資料・巨大ファイルを文脈にできる
- ChatGPT / Claude / Copilotとの比較で、Geminiを選ぶべきユースケースが見えてくる
Geminiとは(モデル系譜・特徴)
Geminiとは、Google(Google DeepMind)が開発するマルチモーダルAIモデルと、それを使ったアシスタント製品の総称だ。テキストだけでなく画像・音声・動画を同じモデルで扱える「ネイティブ・マルチモーダル」と、桁違いに長い文脈を読める「ロングコンテキスト」を当初からの設計思想としてきた。
ここで紛らわしいのが、「Gemini」という言葉が複数のものを指す点だ。具体的には、(1) 推論を行うAIモデルそのもの(Gemini 3.5 Flashなど)、(2) ブラウザやアプリで使う消費者向けアシスタント製品(gemini.google.com)、(3) 開発者がAPIで呼び出すサービス、の3つを同じ名前で呼んでいる。本記事の「Web版・API・コーディング活用」という3つの入口は、ちょうどこの(2)と(3)、そして両方をまたぐコーディング用途に対応している。最初にこの区別を頭に入れておくと、料金やモデルの話が混線しない。
モデルは世代を重ねており、2026年時点の主力はGemini 3.5系だ。系譜と棲み分けを押さえておくと、後述の料金やAPIの話が理解しやすい。
・Gemini 3.5 Flash —— I/O 2026で正式版(GA)として公開された主力モデル。1Mトークン文脈・最大65k出力に対応し、前世代の3.1 Proを多くのベンチで上回りつつ約4倍高速
・Gemini 3.5 Pro / 3.1 Pro —— 難しい推論・長い思考に強い上位モデル。2026年6月にかけて3.5 Proが順次展開
・Gemini 3 Deep Think —— 科学・研究・エンジニアリングなど、じっくり考える複雑なタスク向けの推論モード
・Gemini 2.5 Pro / Flash / Flash-Lite —— 前世代。APIでは引き続き選択でき、コスト最適化の選択肢になる
軽量なオープンウェイト派生として、同じ研究基盤から出た Gemma 4 12B(エンコーダレス・マルチモーダルで256K文脈を16GBノートで動かすオープンモデル) もある。商用APIに頼らずローカルで動かしたいなら、こちらが選択肢になる。
Geminiの特徴を一言でまとめると「Googleのデータとつながる、長文脈に強いマルチモーダルAI」だ。次の図は、3つの入口と背後のモデル・連携先の関係を整理したものだ。
gemini.google.com"] U --> API["API
Google AI Studio"] U --> CODE["コーディング活用
Canvas / SDK / CLI"] WEB --> M["Geminiモデル群
3.5 Flash / Pro / Deep Think"] API --> M CODE --> M M --> WS["Google Workspace連携
Gmail / Docs / Drive"] M --> MM["マルチモーダル
画像 / 音声 / 動画"] M --> LC["1Mトークン長文脈"]
Web版の基本操作
もっとも手軽な入口がWeb版だ。ブラウザで gemini.google.com を開き、Googleアカウントでログインするだけで使い始められる。スマートフォンでは専用アプリ(iOS / Android)からも同じ機能にアクセスできる。
基本は画面下部の入力欄に質問や指示を打ち込むチャット形式だ。だが2026年のGemini Web版は、単なる質問応答にとどまらない機能が揃っている。
・Deep Research —— テーマを渡すと、Webを横断して複数ソースを調べ、出典付きのレポートにまとめる調査モード
・Canvas —— 文章やコードを本文と並べて表示し、その場で書き換え・プレビューできる作業領域。コードは実行結果まで確認できる
・画像生成・編集 —— プロンプトから画像を生成し、自然言語で部分修正できる
・Gemini Live —— 音声でリアルタイムに対話できるモード。カメラ映像を見せながら質問することもできる
・Gems —— 役割や前提を仕込んだ自分専用のカスタムアシスタントを作って再利用する機能
使い始めの実践的な流れはこうだ。まず無料のままチャットで日常の調べ物に使い、長めの調査が必要になったらDeep Researchを呼ぶ。文章やコードを練るときはCanvasに切り替え、本文を見ながら反復する。よく使う指示は毎回打ち直さずGemsに固定しておく。
具体的な操作のコツも押さえておくと迷わない。
・ファイルを直接添付する —— 入力欄の添付アイコンから、画像・PDF・スプレッドシート・音声などをそのまま渡せる。「この資料を要約して」と添えるだけで中身を読んで答える
・会話は文脈が続く —— 直前のやり取りを踏まえて返すので、いきなり完璧な指示を作り込まず、出力を見ながら「もっと短く」「表にして」と段階的に詰めるほうが速い
・モデルを切り替える —— 上位モデルや思考モード(Deep Think)はプランに応じてチャット画面上部のモデル選択から切り替えられる。難しい推論だけ上位に上げると効率的
・出典を確認する —— Deep Researchやウェブ参照の回答には出典リンクが付く。重要な判断に使う情報は、必ずリンク先の一次ソースで裏取りする
Web版は「とりあえず無料で全機能の入口に触れられる」のが利点だ。APIに進む前に、まずここで自分の用途に合うかを見極めるのが遠回りに見えて近道になる。
Geminiは指示の冒頭で「誰に向けて・何の目的で・どんな形式で」を明示すると精度が上がる。「営業向けに・製品比較を・表形式で300字以内」のように、対象・目的・出力形式を先頭で指定するのがコツだ。
API利用の手順
自分のアプリやスクリプトにGeminiを組み込むなら、APIを使う。入口は Google AI Studio(aistudio.google.com) だ。ここでAPIキーを無料で発行し、公式の google-genai SDKから呼び出す。
手順は3ステップで完了する。
・(1) APIキーを発行 —— Google AI Studioにログインし、「Get API key」からプロジェクトを選んでキーを作成。クレジットカード不要で発行できる
・(2) キーを環境変数に設定 —— 発行したキーを GEMINI_API_KEY という環境変数に入れる。コードに直書きしない
・(3) SDKから呼び出す —— google-genai(Python / JavaScript)をインストールし、数行のコードで最初の応答を得る
まずキーを環境変数に通す。
# 発行したAPIキーを環境変数に設定(直書き禁止)
export GEMINI_API_KEY="ここに発行したキー"
# Python SDK を導入する場合
pip install google-genai
Pythonでの最小コードは次のとおり。genai.Client() は環境変数 GEMINI_API_KEY を自動で読み込む。
from google import genai
client = genai.Client()
response = client.models.generate_content(
model="gemini-3.5-flash",
contents="AIの仕組みを一言で説明して",
)
print(response.text)
JavaScript(Node.js)でも同じことが数行で書ける。
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({});
const response = await ai.models.generateContent({
model: "gemini-3.5-flash",
contents: "AIの仕組みを一言で説明して",
});
console.log(response.text);
SDKを入れずに試すなら、REST APIをcurlで直接叩くこともできる。
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.5-flash:generateContent" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-X POST \
-d '{"contents":[{"parts":[{"text":"AIの仕組みを一言で説明して"}]}]}'
2026年のコード例で既定のモデルとして使われるのは gemini-3.5-flash だ。重い推論が必要なら gemini-3.1-pro 系などに切り替える。
Google AI Studioの無料ティアでは、入出力データがGoogleの製品改善(学習)に使われる。検証や学習用途には便利だが、機密情報・顧客データを扱う本番では、有料ティアやVertex AI、Workspace版を使い、データが学習に使われない設定を選ぶこと。
料金プラン2026年版
Geminiの料金は「個人向けサブスク」と「API従量課金」の2系統で考えると整理しやすい。まず個人向けサブスクの全体像を表で押さえる(価格は日本の公式表記、2026年6月時点)。
| プラン | 月額 | 主なモデル | 代表的な特典 | ストレージ |
|---|---|---|---|---|
| Free | ¥0 | 3.5 Flash+3.1 Pro(制限付き) | Deep Research / 画像生成 / Canvas / Live | 15GB |
| Google AI Plus | ¥1,200 | 無料の約2倍の利用上限 | 動画生成 / Flowクレジット200 | 200GB |
| Google AI Pro | ¥2,900 | Gemini 3 Pro / Deep Search / エージェント機能 | 利用上限4倍 / Flow 1,000 / YouTube Premium Lite | 5TB |
| Google AI Ultra | ¥14,500〜¥32,000 | 最上位モデルへの優先アクセス | 上限最大20倍 / Flow 10,000〜25,000 | 20TB+ |
無料プランの守備範囲が広いのがGeminiの特徴だ。まず¥0で使い込み、「上位モデルを使い切れない」「動画生成を使いたい」「ストレージが足りない」と感じた段階で有料へ上げるのが合理的な順番になる。
次にAPIの従量課金だ。こちらは使ったトークン量で課金される。主要モデルの代表的な単価(100万トークンあたり・USD、2026年6月時点)を示す。
| モデル | 入力 | 出力 | 位置づけ |
|---|---|---|---|
| Gemini 3.5 Flash | $1.50 | $9.00 | 主力・高速 |
| Gemini 3.1 Pro(Preview) | $2.00〜$4.00 | $12.00〜$18.00 | 上位推論 |
| Gemini 3.1 Flash-Lite | $0.25 | $1.50 | 軽量・大量処理 |
| Gemini 2.5 Pro | $1.25〜$2.50 | $10〜$15 | 前世代・上位 |
| Gemini 2.5 Flash-Lite | $0.10 | $0.40 | 最安・前世代 |
Proの2段階価格は、文脈が20万トークンを超えると単価が上がる仕組みだ。長文脈は強力だが、積むほど課金額と応答時間が増える点は意識したい。バッチ処理やFlex実行を使うと約50%割引になる枠もある。自分の用途が「どのモデルを・どれだけのトークンで」回すのかを、決定木で逆引きしておくと選びやすい。
自分で使う?"} Q1 -->|"自分で使う"| Q2{"無料の上限で
足りる?"} Q2 -->|"足りる"| FREE["Free ¥0"] Q2 -->|"上位モデル・
動画生成が欲しい"| Q3{"どれくらい
使う?"} Q3 -->|"そこそこ"| PRO["AI Pro ¥2,900"] Q3 -->|"ヘビー・
映像制作も"| ULTRA["AI Ultra ¥14,500〜"] Q1 -->|"アプリに組み込む"| Q4{"速度重視?
推論重視?"} Q4 -->|"速度・大量処理"| FLASH["3.5 Flash / Flash-Lite"] Q4 -->|"難しい推論"| PROAPI["3.1 Pro / Deep Think"]
実践Tips(Geminiならではの活用)
汎用チャットとしてだけ使うのはもったいない。Geminiの設計上の強みを活かす使い方を3つ挙げる。
・マルチモーダルで「見せて訊く」 —— スクリーンショット・写真・図表・PDF・音声を直接貼り付けて質問できる。エラー画面の画像を渡して原因を訊く、グラフ画像から数値を読み取らせる、議事録の音声を要約させる、といった使い方が効く
・長文脈に「丸ごと」渡す —— 1Mトークン文脈を使えば、数百ページの仕様書や長大なコードベース、長時間の会議録を一度に読ませて、横断検索・矛盾チェック・要約ができる。資料を小分けにせず丸ごと渡すのがコツ
・Deep Researchで一次調査を任せる —— 調べ物の初動をDeep Researchに投げると、複数ソースを横断した出典付きレポートが返る。そこから人間が裏取り・取捨選択する分担にすると速い
コードアシストの実践では、Web版のCanvasと、エディタ/CLIからのAPI利用を使い分けるのが基本だ。プロトタイプや学習はCanvasでその場プレビュー、腰を据えた開発はAPIをツールに組み込んで補完・リファクタ・テスト生成に使う。長文脈を活かしてリポジトリ全体を読ませられるのが、コーディング用途でのGeminiの強みになる。
さらに、APIを使うなら覚えておきたい実装上の勘所がある。
・システム指示で役割を固定する —— system_instruction に「あなたはレビュアーです」のような役割と制約を入れておくと、毎回のプロンプトを短くしても出力が安定する
・JSON出力を強制する —— 構造化データが欲しいときはレスポンス形式をJSONに指定する。後段のプログラムでパースする処理が壊れにくくなる
・コンテキストキャッシュで節約する —— 同じ長文(仕様書・コードベース)を何度も渡すなら、キャッシュ機能で入力分の課金を抑えられる。長文脈をくり返し参照する用途で効く
・ストリーミングで体感速度を上げる —— 長い応答は逐次受け取るストリーミングにすると、最初のトークンが早く返り、UIの待ち時間が短く感じられる
これらは小さな工夫だが、コストと応答品質の両方に効く。最初はFlashで安く回し、品質が足りない箇所だけPro系に上げる、という段階的な最適化が現実的だ。
出力がぶれるときは、プロンプトの冒頭で出力の制約を固定するとよい。「初心者向けに・手順を・番号付きリストで・専門用語は注釈つきで」のように指定すると、再現性の高い結果が得られる。よく使う指示はGemsに保存して再利用する。
ChatGPT / Claude / Copilot との比較
GeminiはChatGPT・Claude・GitHub Copilotと比較されることが多い。どれが優れているかではなく、得意領域が違うと捉えるのが実用的だ。
| 項目 | Gemini | ChatGPT | Claude | GitHub Copilot |
|---|---|---|---|---|
| 提供元 | OpenAI | Anthropic | GitHub / Microsoft | |
| 強み | Workspace連携・長文脈・マルチモーダル | エコシステムの広さ・汎用対話 | 長文読解・落ち着いた文章 | エディタ統合のコード支援 |
| 文脈長 | 最大1Mトークン | 大(モデル依存) | 大(長文に定評) | コードベース文脈 |
| 無料枠 | 広い(3.5 Flash等) | あり | あり | 補完月2,000回など |
| 主用途 | 調査・文書・Google業務 | 汎用チャット全般 | 執筆・長文要約 | 実装の補完・自律編集 |
選び方の指針はこうだ。Googleのメールやドキュメントといったデータとつなげたい、巨大ファイルを丸ごと読ませたい、画像・音声も扱いたいならGemini。汎用的な対話やプラグインの広さを取るならChatGPT。長文の執筆・要約の質を最優先するならClaude。エディタ内でのコード補完・自律実装に寄せるならCopilot、という整理になる。
実際には排他ではなく併用が現実的だ。たとえばコード補完は GitHub Copilot に任せつつ、調査と文書作成はGemini、という分担が噛み合う。各社とも複数モデルを切り替えられる方向に進んでおり、用途ごとに最適なものを使い分ける運用が主流になりつつある。
特にGeminiが向いているのは、次のような人だ。
・GmailやドキュメントなどGoogleのサービスを業務の中心に使っており、自分のメール・資料を文脈にAIを動かしたい
・数百ページのPDFや長大なログ・コードベースを丸ごと読ませて、横断検索や要約をしたい
・画像・音声・動画といったテキスト以外の入力を、ひとつのアシスタントでまとめて扱いたい
・まず無料で試し、必要になった機能だけ段階的に課金していく堅実な導入をしたい
・APIを無料キーから手早く立ち上げ、Flashで安く回しながら必要箇所だけ上位モデルに上げたい
逆に、エディタ内のコード補完を一日中使うのが主目的ならCopilotやその競合、長文の執筆品質を最優先するならClaude、というように主用途が明確なら専用ツールが噛み合うこともある。Geminiは「広く・Googleと地続きで・長文脈とマルチモーダルに強い」万能型として位置づけると選びやすい。
エンタープライズ(Workspace連携)
業務でGeminiを使う最大の理由が、Google Workspaceとの統合だ。Gmail・ドキュメント・スプレッドシート・スライド・Drive・Chatの中から、自分の業務データを文脈にしてAIが働く。
・Gemini in Docs —— 白紙から「下書きを作成」で、関連資料を踏まえた整形済みの初稿を生成。Drive・Gmail・Chat・Webの情報を横断して文脈化する
・スプレッドシート / スライド —— 表データの整理・関数提案や、スライドの自動生成・画像挿入を支援
・横断作成 —— 複数アプリのデータを引いて、ドキュメント・シート・スライドをまたいだ成果物を作る
・管理・データ保護 —— 業務データを学習に使わない設定や監査ログなど、管理者が組織ポリシーを統制できる
個人向けの無料Geminiと、Workspace/エンタープライズ版で決定的に違うのがデータの扱いだ。前者は入力が製品改善に使われる場合があるのに対し、企業向けは業務データを学習に使わないことが原則とされ、管理者がデータ保護・監査を設定できる。機密情報を扱うなら、必ずWorkspace版・エンタープライズ契約を選び、公式のデータ取り扱いポリシーを確認すること。
業務での具体的な使い方をイメージすると、価値が分かりやすい。たとえば、受信トレイにたまった長いメールスレッドをGeminiに要約させ、論点と未対応のタスクを箇条書きで抜き出す。Driveに散らばった複数の資料を横断して「四半期の売上推移を表とグラフでまとめた初稿」をドキュメントに生成する。会議の録音から議事録と決定事項のリストを起こす——こうした定型作業を、アプリを行き来せずひとつのアシスタントに任せられる。
なお、より高度な制御や独自アプリへの組み込みが必要なら、Google Cloud側の Vertex AI からGeminiを使う選択肢もある。アクセス権限・ネットワーク・監査をクラウドの統制下に置けるため、規制業種や大規模運用ではこちらが選ばれる。個人のWeb版・AI Studio・Workspace・Vertex AIという4つの入口を、扱うデータの機密度と必要な統制レベルで使い分けるのが、組織導入の勘所になる。
よくある落とし穴
最後に、つまずきやすいポイントを挙げておく。
・無料ティアにデータを渡しすぎる —— 個人向け無料やAI Studio無料ティアは入力が学習に使われる場合がある。機密・顧客データは有料・Workspace版へ
・モデル名の取り違え —— APIでは gemini-3.5-flash のようにバージョン込みでモデルを指定する。世代が変わると挙動・単価が変わるため、固定したいモデル名を明示する
・長文脈の積みすぎ —— 1Mトークン使えるからと全部詰め込むと、課金額と応答時間が膨らむ。必要な範囲に絞る
・Pro系の2段階課金を見落とす —— 文脈が20万トークンを超えると入出力単価が上がる。長文処理のコスト試算に織り込む
・Web版とAPIの取り違え —— ブラウザで使う日常用途はWeb版、アプリ組み込みはAPIと役割が違う。コーディングはCanvas(手軽)とAPI(本格)を使い分ける
・プランで使えるモデルが違う —— 上位モデルやエージェント機能はPro以上が中心。無料で出ない機能はプランの制約であることが多い
これらは事前に把握しておけば避けられる。特にデータ取り扱いとコスト試算は、本番投入前に必ず公式ドキュメントで現況を確認してほしい。
参照ソース
・Google AI for Developers(Gemini API 公式ドキュメント) —— APIキー取得・クイックスタート・SDKの一次情報
・Gemini API Pricing(料金) —— モデル別のトークン単価・無料ティア・バッチ割引
・Gemini 3.5 Flash Model Card(Google DeepMind) —— 1Mトークン文脈・出力上限・性能の一次情報
・Gemini Subscriptions(料金プラン) —— Free / Plus / Pro / Ultra の価格と特典