ラボの設定手順と要件

アカウントと進行状況を保護します。このラボを実行するには、常にシークレットブラウジングウィンドウとラボの認証情報を使用してください。

BigQuery の一般公開データセットを使ってみる

ラボ 1時間 universal_currency_alt クレジット: 5 show_chart 入門

info このラボでは、学習をサポートする AI ツールが組み込まれている場合があります。

概要
環境を設定する
タスク 1. 一般公開データセットに対してクエリを実行する
タスク 2. カスタムテーブルを作成する
タスク 3. データセットを作成する
タスク 4. 新しいテーブルにデータを読み込む
タスク 5. テーブルに対してクエリを実行する
ラボを終了する

このコンテンツはまだモバイルデバイス向けに最適化されていません。

快適にご利用いただくには、メールで送信されたリンクを使用して、デスクトップパソコンでアクセスしてください。

概要

適切なハードウェアとインフラストラクチャを用意することなく大規模なデータセットを保存してクエリを実行すると、多大な時間と費用がかかってしまう可能性があります。エンタープライズデータウェアハウスである Google BigQuery は、Google のインフラストラクチャの処理能力を活用して SQL クエリを超高速で実行し、こうした問題を解決します。ユーザーはデータを BigQuery に読み込むだけです。残りの処理は Google 側で行います。他のユーザーにデータの表示やクエリを許可するなど、ビジネスニーズに基づいてプロジェクトとデータへのアクセスを制御できます。

BigQuery にアクセスするには、Google Cloud コンソールもしくはコマンドラインツールを使用するか、または Java、.NET、Python などの各種クライアントライブラリを使って BigQuery REST API を呼び出します。各種サードパーティ製ツールを使用して BigQuery と通信し、データを可視化したり、データを読み込んだりすることも可能です。このラボでは、ウェブ UI を使用して BigQuery にアクセスします。

Google Cloud コンソールの BigQuery ウェブ UI をビジュアルインターフェースとして使用して、クエリの実行、データの読み込み、データのエクスポートなどのタスクを実行できます。このハンズオンラボでは、一般公開データセットのテーブルをクエリする方法と、Google Cloud コンソールを使用して BigQuery にサンプルデータを読み込む方法を学びます。

目標

このラボでは、次のタスクの実行方法について学びます。

一般公開データセットに対してクエリを実行する
カスタムテーブルを作成する
テーブルにデータを読み込む
テーブルに対してクエリを実行する

環境を設定する

ラボの設定

各ラボでは、新しい Google Cloud プロジェクトとリソースセットを一定時間無料で利用できます。

シークレットウィンドウを使用して Google Skills にログインします。
ラボのアクセス時間（例: 1:15:00）に注意し、時間内に完了できるようにしてください。一時停止機能はありません。必要な場合はやり直せますが、最初からになります。
準備ができたら、[ラボを開始] をクリックします。
ラボの認証情報（ユーザー名とパスワード）をメモしておきます。この情報は、Google Cloud コンソールにログインする際に使用します。
[Google コンソールを開く] をクリックします。
[別のアカウントを使用] をクリックし、このラボの認証情報をコピーしてプロンプトに貼り付けます。他の認証情報を使用すると、エラーや料金が発生します。
利用規約に同意し、再設定用のリソースページをスキップします。

BigQuery コンソールを開く

Google Cloud コンソールで、ナビゲーションメニュー > [BigQuery] を選択します。

[Cloud Console の BigQuery へようこそ] メッセージボックスが開きます。このメッセージボックスにはクイックスタートガイドへのリンクと、UI の更新情報が表示されます。

[完了] をクリックします。

タスク 1. 一般公開データセットに対してクエリを実行する

このタスクでは、一般公開データセットの USA Names を BigQuery に読み込んでクエリを実行し、1910 年から 2013 年の間に米国で最も多く付けられた名前を特定します。

USA Names データセットを読み込む

[エクスプローラ] ペインで、[検索語句を入力] に usa_names と入力して Enter キーを押します。
[すべてのプロジェクトを検索] をクリックします。
[エクスプローラ] ペインで、bigquery-public-data にカーソルを合わせて「スターを付ける」をクリックします。
[検索語句を入力] に bigquery-public-data と入力すると、プロジェクトのすべてのデータセットが表示されます。

注: 新しいプロジェクトの bigquery-public-data が [エクスプローラ] ペインに表示されない場合は、[+ 追加] > [名前を指定してプロジェクトにスターを付ける] > [プロジェクトにスターを付ける] で bigquery-public-data と入力して [スターを付ける] をクリックします。

bigquery-public-data の [ノードを開く] をクリックします。
一般公開データセットのリストを下にスクロールし、必要に応じて [さらに表示] をクリックしながらスクロールを続け、[usa_names] を探します。
[usa_names] をクリックしてデータセットを展開します。
[usa_1910_2013] をクリックして、このテーブルを開きます。

USA Names データセットに対してクエリを実行する

bigquery-public-data.usa_names.usa_1910_2013 に対してクエリを実行します。このデータセットで新生児の名前と性別を調べて、上位 10 件の名前を降順で表示します。

[クエリ]、[新しいタブ] の順にクリックします。
以下のクエリをコピーしてクエリエディタのテキストエリアに貼り付け、既存のクエリを置き換えます。

SELECT name, gender, SUM(number) AS total FROM `bigquery-public-data.usa_names.usa_1910_2013` GROUP BY name, gender ORDER BY total DESC LIMIT 10

ウィンドウの右上のクエリバリデータを確認します。

クエリエディタでハイライト表示されているクエリバリデータ

クエリが有効な場合は、緑色のチェックマークアイコンが表示されます。クエリが無効な場合は、赤色の感嘆符アイコンが表示されます。クエリが有効な場合は、クエリの実行時に処理されるデータ量も確認できます。これは、クエリ実行のコストを判断するのに役立ちます。

[実行] をクリックします。

クエリエディタの下にクエリ結果が表示されます。[クエリ結果] の上部には、クエリによって処理されたデータ量と経過時間が表示されます。また、時間の下の表にはクエリ結果が表示されます。ヘッダー行には、クエリの GROUP BY で指定した列の名前が含まれています。

タスク 2. カスタムテーブルを作成する

このタスクでは、カスタムテーブルを作成してデータを読み込み、そのテーブルに対してクエリを実行します。

ローカルのパソコンにデータをダウンロードする

ダウンロードするファイルには、米国社会保障局から提供された、人気のある新生児の名前に関する約 7 MB のデータが含まれています。

新生児の名前の zip ファイルをローカルのパソコンにダウンロードします。注: 上記リンクからダウンロードできない場合は、操作ガイドの左側のペインにある受講者向けリソースから新生児の名前の zip ファイルをコピーしてください。
パソコン上でファイルを解凍します。
yob2014.txt というファイルを開いて、データの内容を確認します。これは、名前、性別（M または F）、その名前の新生児の数を示す 3 つの列を含むカンマ区切り値（CSV）ファイルです。このファイルにはヘッダー行がありません。
後で確認できるように、yob2014.txt ファイルの場所をメモします。

タスク 3. データセットを作成する

このタスクでは、テーブルを格納するデータセットを作成し、プロジェクトにデータを追加して、クエリの対象となるデータテーブルを作成します。

データセットは、プロジェクト内のテーブルとビューへのアクセス制御に役立ちます。このラボではテーブルを 1 つしか使用しませんが、テーブルを格納するデータセットは必要です。

Cloud コンソールに戻り、[エクスプローラ] ペインの [検索語句を入力] ボックスから bigquery-public-data を削除します。

注: 名前を指定してプロジェクトにスターを付ける方法を使用した場合は、上にスクロールして検索結果の一番上まで戻ります。

プロジェクト ID（qwiklabs で始まる ID）をクリックします。

エクスプローラセクションとプロジェクトのデータセットがハイライト表示された Cloud コンソール

プロジェクト ID の横にあるその他アイコンをクリックし、[データセットを作成] をクリックします。
[データセットを作成する] ページで次の操作を行います。
- [データセット ID] に「babynames」と入力します。
- [ロケーションタイプ] で [マルチリージョン] をオンにし、[us（米国の複数のリージョン）] を選択します。
- [デフォルトのテーブルの有効期限] はデフォルト値のままにしておきます。
- [暗号化] はデフォルト値のままにしておきます。
ペインの下部にある [データセットを作成] をクリックします。

タスク 4. 新しいテーブルにデータを読み込む

このタスクでは、作成したテーブルにデータを読み込みます。

[エクスプローラ] ペインでプロジェクト ID データセットを開きます。
babynames の横にあるその他アイコン、[テーブルを作成] の順にクリックします。

別途指定のない限り、すべての設定にデフォルト値を使用します。

[テーブルの作成] ページで次の操作を行います。
- [ソース] で [テーブルの作成元] プルダウンメニューから [アップロード] を選択します。
- [ファイルを選択] で [参照] をクリックし、yob2014.txt ファイルを選択して [開く] をクリックします。
- [ファイル形式] で、プルダウンメニューから [CSV] を選択します。
- [テーブル] に「names_2014」と入力します。
- [スキーマ] セクションで [テキストとして編集] をクリックし、次のスキーマ定義をテキストボックスに貼り付けます。

name:string,gender:string,count:integer

[テーブルを作成] をクリックします（ウインドウの下部にあります）。

注: インポートエラーが表示されても、データのインポートは実行されています。エラーをクリアするには、[閉じる] をクリックしてから [キャンセル] をクリックしてインポートダイアログを終了します。変更が保存されない旨の警告が表示されたら [はい、終了します] をクリックします。

テーブルをプレビューする

[エクスプローラ] ペインで、[babynames] > [names_2014] を選択します。
詳細ペインで [プレビュー] タブをクリックします。

タスク 5. テーブルに対してクエリを実行する

テーブルにデータが読み込まれたので、クエリを実行できます。手順は前の例とまったく同じです。ただし今回は、一般公開テーブルではなく自分のテーブルに対してクエリを実行します。

クエリエディタで、[SQL クエリを作成] をクリックします。
次のクエリをコピーして、クエリエディタに貼り付けます。このクエリは、2014 年に米国で人気が高かった男の子の名前、上位 5 つを取得します。

注: '' で囲った部分は大文字と小文字が区別されるため、作成したデータセットとテーブルの名前に正確に一致させてください。

SELECT name, count FROM `babynames.names_2014` WHERE gender = 'M' ORDER BY count DESC LIMIT 5

[実行] をクリックします。結果はクエリウィンドウの下に表示されます。

お疲れさまでした

ここでは、まず一般公開データセットに対してクエリを実行しました。次にカスタムテーブルを作成してデータを読み込み、それに対してクエリを実行しました。

ラボを終了する

ラボが完了したら、[ラボを終了] をクリックします。ラボで使用したリソースが Google Skills から削除され、アカウントの情報も消去されます。

ラボの評価を求めるダイアログが表示されたら、星の数を選択してコメントを入力し、[送信] をクリックします。

星の数は、それぞれ次の評価を表します。

星 1 つ = 非常に不満
星 2 つ = 不満
星 3 つ = どちらともいえない
星 4 つ = 満足
星 5 つ = 非常に満足

フィードバックを送信しない場合は、ダイアログボックスを閉じてください。

フィードバックやご提案の送信、修正が必要な箇所をご報告いただく際は、[サポート] タブをご利用ください。

BigQuery の一般公開データセットを使ってみる

概要

目標

環境を設定する

ラボの設定

BigQuery コンソールを開く

タスク 1. 一般公開データセットに対してクエリを実行する

USA Names データセットを読み込む

USA Names データセットに対してクエリを実行する

タスク 2. カスタム テーブルを作成する

ローカルのパソコンにデータをダウンロードする

タスク 3. データセットを作成する

タスク 4. 新しいテーブルにデータを読み込む

テーブルをプレビューする

タスク 5. テーブルに対してクエリを実行する

お疲れさまでした

ラボを終了する

始める前に

シークレット ブラウジングを使用する

コンソールにログインする

シークレット ブラウジングを使用してラボを実行する

タスク 2. カスタムテーブルを作成する

シークレットブラウジングを使用する

シークレットブラウジングを使用してラボを実行する