登録くんと一緒に、国立がん研究センター『がん情報サービス』の公開データを図解でやさしく学ぶ「やさしいがん統計ガイド(Easy Cancer Analytics Guide)」のホーム画像です。 Learn with Touroku-kun about public data from the National Cancer Center’s Cancer Information Service, explained gently with illustrations in the Easy Cancer Analytics Guide homepage image.
全国がん登録シリーズ

【3.】がんを多い順に!がん統計の分析

登録くん
登録くん
わぁ、とうとうExcelで最新のがん統計を見てみるんですね!ドキドキします。
yoko先生
yoko先生
そうですね、登録くん。
国立がん研究センターの統計と同じ順位になるか、一緒に確認していきましょう。

【目的】「最新がん統計」の表をExcelで再現する

この記事では、最新がん統計の順位表をExcelで再現する方法を紹介します。

使用するのは「全国がん登録」のデータです。毎年更新されるので、つねに最新の統計を作ることができます。

再現性が高く、誰でも簡単に取り組めます。さあ、一緒に作ってみましょう!

2021年日本のがん罹患数の順位表。男女計では1位大腸、2位胃、3位肺、4位乳房、5位前立腺
出典:最新がん統計:[国立がん研究センター がん統計]
【完成イメージ】

登録くん
登録くん
「最新がん統計」によると、総数で最も多いのは「大腸」、男性では「前立腺」、女性では「乳房」なんですね。
yoko先生
yoko先生
その通りです。
私たちも順位が同じになるか、Excelで分析していきましょう。

3.1 全国がん登録データをExcelで分析

登録くん
登録くん
前回、 Excelファイルをダウンロードしましたよね。
どこで確認できますか?
yoko先生
yoko先生
特に指定してなければ、ダウンロードフォルダに入っていますよ。

では、さっそくExcelファイルを開いて、見本と同じ順になるか確認しながら表を作っていきましょう。

【試用するデータ】
・ファイル名:「全国がん登録(2016-2021)
・保存場所:ダウンロードフォルダ(特に指定なしの場合)

※ダウンロード方法は、【2.】がん登録データをダウンロードしようで解説しています。

3.1.1 Excelを開く(がん統計データ確認)

登録くん
登録くん
Excelを開くと、「ファイル内容」シートが表示されます。
3行目から8行目には、各シートに保存されている内容が書かれていますね?
yoko先生
yoko先生
そうですね。今回は「number」というシートを使います。
シート名「number」を開いて、内容を確認してみましょう。

こちらが、「number」というシート名です。

Excelで作成したがん登録データの分析方法(全国がん登録データのtitleシート)

3.1.2 分析前のちょっとしたアドバイス

登録くん
登録くん
シートを開くと、数字ばかりですね…。
こんなデータは僕には まだ難しすぎます…。実はまだ、Excelがわからなくて…
yoko先生
yoko先生
大丈夫ですよ。
Excelの便利な機能をわかりやすく説明しますね。いろんな方法がありますが、ここで紹介するのはあくまで一例です。

【アドバイス①】

Excel初心者の人は、ここで紹介した手順を参考にして進めてください
Excelに慣れている人は、自分のやりやすい方法で分析して大丈夫です

yoko先生
yoko先生
一度ここでファイルを名前を付けて保存しておくと安心です。
登録くん
登録くん
僕、前にパソコンが動かなくなっちゃって、データが消えたことあったんです。
作業中もこまめに保存していきます!

【アドバイス②】

・作業するデータはこまめに保存しましょう
名前を付けて保存することをお勧めします

3.2 Excelでピボットテーブルを作成する方法

登録くん
登録くん
ピボットテーブルって、よく聞きますけど…何ができる機能なんですか?
yoko先生
yoko先生
ピボットテーブルは、Excelのとても便利な機能ですよ。

たくさんのデータの中から、自分が知りたい情報だけを簡単に取り出して整理できるんです。

がん登録データのように項目が多い表でも、見やすくまとめられます。

【ピボットテーブルとは?】
大量のデータ簡単に集計・分析できるExcelの機能
元のデータはそのままにして分析できる
・行・列・値・フィルターを自由に入れ替えられる
・合計・平均・件数などを簡単に計算できる

3.2.1 ピボットテーブルの挿入(Excelでがん統計分析用)

登録くん
登録くん
どうすれば、ピボットテーブルをつくれますか?
yoko先生
yoko先生
「number」シートの空白以外のセルを選びましょう。
今回はB6セルを選んでください。
次に、「挿入」タブの一番左にある「ピボットテーブル」をクリックしてください。

【手順3.2.1】ピボットテーブルの挿入

・「number」シートの空白以外のセルを選択
「挿入」タブの一番左「ピボットテーブル」を選択

3.2.2 データ範囲の確認とピボットテーブル作成(がん統計)

登録くん
登録くん
先生、データ範囲ってどこまで選べばいいんですか?
yoko先生
yoko先生
Excelが自動的に、データが入っている範囲全体を選択してくれます。
今回の表は 625行 × AD列まで あるため、範囲は number!$A$1:$AD$625 になります。
新規ワークシートを選んでピボットテーブルを挿入しましょう。

【手順3.2.2】データ範囲の確認とピボットテーブル作成

データ範囲を確認
 ・「number」シートの空白以外のセルを選ぶ(今回は B6セル)
 ・先に1セルを選ぶだけで、Excelが自動で範囲を判定
 ・今回は 625行 × AD列(number!$A$1:$AD$625
ピボットテーブルの配置場所を設定
 ・すべてのデータが選択されていることを確認
 ・配置場所を 「新規ワークシート」 に設定
ピボットテーブルを作成
 ・「OK」をクリック
これで、新しいシートにピボットテーブルが作成され、分析の準備完了です。

Excelで作成したがん登録データの分析方法(ピボットテーブル挿入)
登録くん
登録くん
おおっ、これがピボットテーブルなんですね!
ワクワクします!

3.3 ピボットテーブルにデータを入れる方法

登録くん
登録くん
先生、ピボットテーブルにデータを入れるにはどうすればいいんですか?
yoko先生
yoko先生
簡単ですよ。
まず、画面の右側に「ピボットテーブルのフィールド」が表示されているのを確認してください。
ここから集計に使いたい項目をドラッグして、箱(エリア)に入れていきます。

3.3.1 フィールドに項目を入れる

【フィールドに入れる項目】
列:性別
行:「診断年」の下に部位
値:全年齢

登録くん
登録くん
それぞれの項目をドラッグして配置するだけなので、かんたんですね。

【手順3.3.1】フィールドに項目を入れる

・「ピボットテーブルのフィールド」を表示
集計に使いたい項目を列・行・値のエリアにドラッグ
  列:性別
  行:「診断年」の下に部位
  値:全年齢

登録くん
登録くん
なんだかデータがいっぱい出てきましたね…。こんな大量のデータ、僕には扱えません…。
yoko先生
yoko先生
そうですね、縦に200行以上もある長い表ですね。
でも大丈夫です。最後にはシンプルになりますので、安心して次のステップに進みましょう。

本来、この表から有意義な情報を引き出すには、がん登録の特徴を理解しておく必要があります。しかし、ここではその説明は後ほど行うことにして、まずはピボットテーブルの操作方法を先にご紹介します。

3.3.2 Σ値/全年齢の意味

登録くん
登録くん
先生、このピボットテーブルの左下にある「Σ値」が「合計/全年齢」ってなっていますけど、これは何を意味しているんですか?
yoko先生
yoko先生
いい質問ですね。
「合計/全年齢」というのは、全年齢の人数を合計した数が表示されているという意味です。
登録くん
登録くん
つまり、この数字は各部位に発生したがんの件数ということですか?
yoko先生
yoko先生
その通りです。
ピボットテーブルで「Σ値/全年齢」を見ると、部位ごとのがん件数の合計が一目でわかりますよ。

3.3.3 ピボットテーブルの並び順を確認

登録くん
登録くん
先生、ピボットテーブルを作ったばかりの状態では、並び順ってどうなっているんですか?
yoko先生
yoko先生
最初は「診断年」が 2016年から2021年 の順に並び、「部位」は 50音順 になっています。
登録くん
登録くん
なるほど。今回は「最新がん統計」と同じように、2021年のがん罹患数の順位で表示したいんですよね。
yoko先生
yoko先生
その通りです。
ですから、この後は並び順を変更して、2021年の罹患数が多い順に表示できるように設定していきますよ。

見本にしたい「最新がん統計」はこのように多い順で並んでいます。男女別と総数の3項目の順位を表示していきましょう。

2021年日本のがん罹患数の順位表。男女計では1位大腸、2位胃、3位肺、4位乳房、5位前立腺
出典:最新がん統計:[国立がん研究センター がん統計]

3.4 必要な項目を表示してみましょう

登録くん
登録くん
こんなに多いピボットテーブルの内容が見本のようになるんですか?
yoko先生
yoko先生
そのとおりです。
項目を正しく選ぶことで、見やすくて使いやすい表になりますよ。
一緒に確認していきましょう。

ピボットテーブルの内容を次のように設定すると、見本と同じ項目に並びます。

【項目の並びを設定】
3.4.1 診断年を2021年だけにする
3.4.2 性別順を「総数」「男」「女」に整える
3.4.3 総数を非表示にする

3.4.1「診断年」を2021年だけにする方法

登録くん
登録くん
先生、「診断年」ってどうやって2021年だけに絞ればいいんですか?
yoko先生
yoko先生
いい質問ですね。
「診断年」のセルの右側にあるリストボックスを開いてみてください。
2016年から2021年までのチェックボックスが表示されますよ。2021年だけにチェックを入れて、その他は外してください。

【手順3.4.1】「診断年」を2021年にする方法

・「診断年」のセル右側にある リストボックス をクリック
・表示されたチェックボックスから 2016~2020年のチェックを外す
2021年だけにチェックを入れる
・2021年のデータのみ が表示されていることを確認

3.4.2 性別順を「総数」「男」「女」に整える

登録くん
登録くん
yoko先生、今は性別の並びが「女」「総数」「男」になっています。
これって見本とちがいますよね?
yoko先生
yoko先生
そうですね。
見本と同じように「総数」「男」「女」の順にそろえましょう。
順番を整えるだけで、グラフも見やすくなりますよ。

まず、ポインタを「女」セルの枠線に近づけると、黒い十字矢印に変わります。その瞬間に「女」セルをドラッグし、「男」セルの右側まで移動させてドロップします。

黒い十字矢印を右側に移動すると、下図のように太い緑色のバーが表示されます。そのままドラッグしたまま、「男」セルの右側まで移動させてドロップします。すると、「女」セル「男」セルの右側に移動します。

「総数」「男」「女」の順に並びました。ここで注目してほしいのは、**「総計」**です。(「総数」ではありません!)「総数」には男女を合計した値が表示されています。つまり、「総数」=「男」+「女」がすでに成り立っているので、この場では「総計」は不要です。

【手順3.4.2】性別順を「総数」「男」「女」に整える

・現在の性別の並びを確認:「女」「総数」「男」
・ポインタを「女」セルの枠線に近づけ、黒い十字矢印に変わったらドラッグ開始
「女」セルを「男」セルの右側まで移動してドロップ
・並び順が「総数」「男」「女」になったことを確認
・ポイント:「総計」は不要

3.4.3 総数を非表示にする方法

登録くん
登録くん
先生、男女の罹患数は「総数」で合算されているんですよね?
「総計」って必要ですか?
yoko先生
yoko先生
いいところに気づきましたね。
「総数」で男女の罹患数はすでに合算されているので、ここでは「総計」は不要です。
非表示にして、表をシンプルにしましょう。
yoko先生
yoko先生
1. ピボットテーブルの 「デザイン」タブ を選択します。
2.「総計」ボタン から 「行と列の集計を行わない」 を選びます。
これで「総計」が消えて、表がスッキリしますよ。
登録くん
登録くん
そうですね、「総計」が消えて、表はシンプルになりました!

【手順3.4.3】総数を非表示にする方法

・ピボットテーブルの 「デザイン」タブ を選択
・「総計」ボタン をクリック
「行と列の集計を行わない」 を選択
・「総計」が消え、表がシンプルになるのを確認

3.5 罹患数をがんの多い順に

登録くん
登録くん
yoko先生、僕でもわかりやすい表になりました!
次は何をすればいいですか?
yoko先生
yoko先生
そうですね、登録くん。

さあ、最終段階ですよ!
見本と同じように、順位を多い順に並べていきましょう。
「総数」「男」「女」それぞれを多い順に表示したあと、ピボットの外で表をまとめていきます!

ここでは4つの手順があります。一つ一つ一緒にやっていきましょう!

【罹患数をがんの多い順にする4つの手順】
3.5.1 「総数」を多い順に並び替える
3.5.2 「全部位」を非表示にする
3.5.3 「結腸」と「直腸」を非表示にする
3.5.4 「上皮内がん」を非表示にする方法

3.5.1「総数」を多い順に並び替える方法

がん罹患数の多い順に並べ替えると、どの部位が多いか一目でわかります。では、さっそく操作してみましょう。

上図のように、「総数」列を降順に並び替えると、上から罹患数の多い順に並んで表示されます。

登録くん
登録くん
「こうじゅん」って言葉、よく聞きますけど…どういう意味ですか?
yoko先生
yoko先生
簡単に言うと、「降順」は多い順と覚えておくと便利です。
がん罹患数の順位を確認するときによく使いますので、しっかり覚えておきましょう。
登録くん
登録くん
はい、先生。

【手順3.5.1】「総数」を多い順に並び替える方法

・「総数」列のセルを選択
右クリックで「並び替え」を選択
「降順」を選択して多い順する

3.5.2「全部位」を非表示にする方法

登録くん
登録くん
先生、全部位ってケタ外れな件数ですね。
「全部位」って必要ですか?
yoko先生
yoko先生
いいところにきづきましたね。
『部位』のフィルター機能を使いましょう。
見たくない行を非表示にできますよ。
登録くん
登録くん
なるほど!フィルターで不要な行を非表示にしていけばいいんですね。

多い順に並べると、「全部位」が一番上に表示されます。これは、すべての合計のことですので、一番多くて当然ですね。件数もケタ外れです。各部位で比較したいので、今回は非表示にしましょう。

上図のように、「部位」セルに右側にあるフィルター機能を開きます。部位の一覧の中から「全部位」のチェックボックスを外しましょう。

【手順3.5.2】「全部位」を非表示にする方法

「部位」セルの右側にある フィルター機能 を開く
・部位の一覧から「全部位」チェックボックスを外す

3.5.3「結腸」と「直腸」を非表示にする方法

yoko先生
yoko先生
がん登録では「結腸」と「直腸」をまとめて 「大腸」 というカテゴリーで集計しているんですよ。
登録くん
登録くん
たしかに、見本の「最新がん統計」の表でも「大腸」のカテゴリーを使っていますね。
yoko先生
yoko先生
その通りです。
ですので、今回は「結腸」と「直腸」を非表示にして、「大腸」として集計できるように設定していきますよ。
yoko先生
yoko先生
上図のように、「部位」セルに右側にあるフィルター機能を開きます。部位の一覧の中から「結腸」と「結腸(上皮内がん含む)」のチェックボックスを外しましょう。
登録くん
登録くん
同じように、「直腸」と「直腸(上皮内がん含む)」のチェックボックスを外せばいいんですね!

【手順3.5.3】「結腸」と「直腸」を非表示にする方法

・「部位」セルの右側にある フィルター機能 を開く
・部位の一覧から「結腸」「結腸(上皮内がん含む)」チェックボックスを外
・部位の一覧から「直腸」「直腸(上皮内がん含む)」チェックボックスを外す

3.5.4「上皮内がん」を非表示にする方法

登録くん
登録くん
同じ部位なのに「上皮内がん含む」って書いてあるものがありますね。
これは何ですか?
yoko先生
yoko先生
上皮内がん」というのは、上皮(上の皮)にとどまるがんのことです。
皮膚の表面にとどまっている状態と理解してよいです。
「浸潤がん」と区別され、集計から除外されることもあります。

「最新がん統計」では「上皮内」を含めていません。ここでも同様に、「上皮内」は表示しないようにしましょう。

上図のように、「部位」セルに右側にあるフィルター機能を開きます。ラベルフィルターをクリックし、指定の値を含まないを選択しましょう。すると、小ウィンドウが開きます。ここに「上皮内」と入力すると、一覧からその文字を含むデータが自動で外れます。

【手順3.5.4】「上皮内がん」を非表示にする方法

・「ラベルフィルター」を選択
・「指定の値を含まない」を選択
・「上皮内」と入力

登録くん
登録くん
先生、Excelのラベルフィルターって何ですか?
使ったことがなくて、よくわかりません…。
yoko先生
yoko先生
Excelのラベルフィルターは、データを条件に合わせて絞り込む機能です。
文字列の一致・不一致や特定のパターンなど、さまざまな条件で必要な情報だけを簡単に確認できます。

【3.5】まとめ

登録くん
登録くん
先生、手順が多くて、頭の中がごちゃごちゃです。
yoko先生
yoko先生
よくがんばりましたね。
ここで行った操作は次の4つです。

3.5.1 「総数」を降順に並び替え
3.5.2 「全部位」を非表示
3.5.3 「結腸」と「直腸」を非表示
3.5.4 「上皮内」を非表示

これで、見本と同じように必要な部位だけを表示した表になっていますよ。

登録くん
登録くん
とてもスッキリして、見やすい表になりましたね。
yoko先生
yoko先生
ここで注意するのは、多い順になっているのは「総数」だけ、ということです。
慣れてくると、「男」列や「女」列も多い順に簡単に並び替えることができますよ。

ピボットテーブルを使ったことがある人
・「男」「女」列も多い順に並び替えてみましょう。
・「最新がん統計」の表と見比べて、表記と同じ順になっているか確認してください。

次の記事では表を作成していきましょう

登録くん
登録くん
わぁ、すごく見やすくなって楽しかったです!
「総数」を多い順に並べて、必要な部位に絞るだけでこんなに変わるんですね。
yoko先生
yoko先生
よくがんばりましたね。
今回のやり方は、いろいろな場面で応用できますよ。
次の記事では、このピボットテーブルを使って、見本の「最新がん統計」と同じように罹患の多い順で表を作る方法を確認していきましょう。

▶ 続けて読む:【4.】あとはExcelでコピペ!がんの多い順

応援よろしくお願いします!
がん統計ブログ|にほんブログ村プロフィールページへ