Touroku-kun reviewing the latest cancer registry data、登録くんと一緒にがん登録の公開データを見て、最新のがん統計情報を学んでいるイメージ画像
シリーズ

【3.】がんを多い順に!がん統計の分析

3.0 「最新がん統計」の表をExcelで再現してみましょう

見本:国立がん研究センターの順位表

登録くん
登録くん
とうとうExcelで分析ですね、yoko先生。
yoko先生
yoko先生
そうですね、登録くん。
国立がん研究センターに掲載されている「最新がん統計」と同じ順位になるか、いっしょに確認していきましょう。
2021年日本のがん罹患数の順位表。男女計では1位大腸、2位胃、3位肺、4位乳房、5位前立腺
出典:最新がん統計:[国立がん研究センター がん統計]

完成イメージ】↓

【ねらい】
今回の記事では、国立がん研究センターが公開している「最新がん統計」に掲載された、がんの罹患数の順位を見本にしていきます。ダウンロードデータを用いて、同じ順位になるかを確認していきます。

公開データによると、それぞれ多い順がちがうようです。

  • 総数で最も多い:「大腸
  • 男性で最も多い:「前立腺
  • 女性で最も多い:「乳房
登録くん
登録くん
「最新がん統計」によると、総数で最も多いのは「大腸」、男性では「前立腺」、女性では「乳房」なんですね。
yoko先生
yoko先生
その通りです。
私たちも順位が同じになるか、Excelで分析していきましょう。

3.1 がん統計データをExcelで開いてみましょう

がん罹患数・全国がん登録データを使う方法

登録くん
登録くん
【2. がん登録データをダウンロードしよう】 でExcelファイルをダウンロードしましたよね。
どこで確認できますか?
yoko先生
yoko先生
特に指定してなければ、ダウンロードフォルダに入っていますよ。

では、さっそくExcelファイルを開いて、見本と同じ順になるか確認しながら表を作っていきましょう。

今回は、ダウンロードデータを使います。2.4【全国がん登録データをダウンロードする】の手順で、ファイル名「全国がん登録(2016-2021)」という名前で保存してあります。ダウンロードフォルダを開いて、保存されているファイルを開きましょう

① Excelを開く(がん統計データ確認)

Excelを開くと、次のような画面が表示されます。「ファイル内容」シートの3行目から8行目には、各シートに保存されている内容が書かれています。今回使うのは「number」というシートです。シート名「number」を開いて、内容を確認してみましょう。

こちらが、「number」というシート名です。

Excelで作成したがん登録データの分析方法(全国がん登録データのtitleシート)

②数字が多くても安心

登録くん
登録くん
シートを開くと、数字ばかりですね…。
こんなデータは僕には まだ難しすぎます…。
yoko先生
yoko先生
大丈夫ですよ。
Excelの便利な機能を使えば、誰でも簡単に分析できますよ。

Excelでの分析方法はいろいろありますが、ここでご紹介するのはあくまで一例です。ぜひ参考にして、皆さんのやりやすい方法で進めてみてください。

3.2 ピボットテーブルで罹患数を見てみましょう

Excelでピボットテーブルを作成する方法

登録くん
登録くん
ピボットテーブルって、よく聞きますけど…何ができる機能なんですか?
yoko先生
yoko先生
ピボットテーブルは、Excelのとても便利な機能ですよ。

たくさんのデータの中から、自分が知りたい情報だけを簡単に取り出して整理できるんです。

がん登録データのように項目が多い表でも、見やすくまとめられます。

①ピボットテーブルの挿入(Excelでがん統計分析用)

「number」シートの空白以外のセルを選択します。ここでは、B6セルを選択しています。

「挿入」タブの一番左にある「ピボットテーブル」を選択します。

②データ範囲を確認(がん統計)


Excelが自動的に、データが入っている範囲全体を選択してくれます。
今回の表は 625行 × AD列まで あるため、範囲は

number!$A$1:$AD$625

となります。

③データ範囲と配置場所を確認(Excelでがん統計分析)

  • すべてのデータが選択されていること
  • ピボットテーブルを配置する場所を「新規ワークシート」

④OKをクリックしてピボット作成(がん統計分析)

これで、新しいシートにピボットテーブルが作成されます。

ピボットテーブルが作られました。

Excelで作成したがん登録データの分析方法(ピボットテーブル挿入)

3.3 ピボットテーブルでがん統計を加工してみましょう

ピボットテーブルにデータを入れる方法

必要な項目をえらぶ

  • :性別
  • :「診断年」の下に部位
  • :全年齢

画面の右側に「ピボットテーブルのフィールド」が表示されています。ここから、集計に使いたい項目をドラッグして、箱(エリア)に入れていきます。

それぞれの項目をドラッグして配置するだけなので、かんたんです。

登録くん
登録くん
なんだかデータがいっぱい出てきましたね…。こんな大量のデータ、僕には扱えません…。
yoko先生
yoko先生
そうですね、縦に200行以上もある長い表ですね。
でも大丈夫です。最後にはシンプルになりますので、安心して次のステップに進みましょう。

本来、この表から有意義な情報を引き出すには、がん登録の特徴を理解しておく必要があります。しかし、ここではその説明は後ほど行うことにして、まずはピボットテーブルの操作方法を先にご紹介します。

Σ値/全年齢の意味を理解する

ピボットテーブルの左下「Σ値」が「合計/全年齢」になっています。これは、全年齢の人数を合計した数が表示されています。つまり、各部位に発生したがんの件数ということになります。

現在の並び順を理解する

ピボットテーブルを作った最初の状態では、「診断年」は2016年から2021年「部位」は50音順に並んでいます。ここでは「最新がん統計」と同じように、2021年がん罹患数を順位で表示したいので、設定を変更していきます。

見本にしたい「最新がん統計」はこのように多い順で並んでいます。男女別と総数の3項目の順位を表示していきましょう。

2021年日本のがん罹患数の順位表。男女計では1位大腸、2位胃、3位肺、4位乳房、5位前立腺
出典:最新がん統計:[国立がん研究センター がん統計]

3.4 必要な項目を表示してみましょう

登録くん
登録くん
こんなに多いピボットテーブルの内容が見本のようになるんですか?
yoko先生
yoko先生
そのとおりです。
項目を正しく選ぶことで、見やすくて使いやすい表になりますよ。
一緒に確認していきましょう。

ピボットテーブルの内容を次のように設定すると、見本と同じ項目に並びます。

  1. 診断年を2021年だけにする
  2. 「性別」を見本と同じ順番に並べる
  3. 「総数」を非表示にする

①「診断年」を2021年にする方法

「診断年」セルの右側にあるリストボックスを開きます。すると、2016年から2021年までのチェックボックスが表示されます。2021年だけにして、その他のチェックを外しましょう。

② 性別順を整える方法

登録くん
登録くん
yoko先生、今は性別の並びが「女」「総数」「男」になっています。
これって見本とちがいますよね?
yoko先生
yoko先生
そうですね。
見本と同じように「総数」「男」「女」の順にそろえましょう。
順番を整えるだけで、グラフも見やすくなりますよ。

まず、ポインタを「女」セルの枠線に近づけると、黒い十字矢印に変わります。その瞬間に「女」セルをドラッグし、「男」セルの右側まで移動させてドロップします。

黒い十字矢印を右側に移動すると、下図のように太い緑色のバーが表示されます。そのままドラッグしたまま、「男」セルの右側まで移動させてドロップします。すると、「女」セル「男」セルの右側に移動します。

「総数」「男」「女」の順に並びました。ここで注目してほしいのは、**「総計」**です。(「総数」ではありません!)「総数」には男女を合計した値が表示されています。つまり、「総数」=「男」+「女」がすでに成り立っているので、この場では「総計」は不要です。

③総数を非表示にする方法

男女の罹患数は「総数」で合算されていますので、「総計」を非表示にします。そのために、次の図のようにチェックしていきます。

  • ピボットテーブルの「デザイン」タブを選択
  • 「総計」ボタンから「行と列の集計を行わない」を選択

すると、「総計」が消えて、表はシンプルになりました。

3.5 がん罹患数を多い順に並び替えて見やすく整えましょう

登録くん
登録くん
yoko先生、僕でもわかりやすい表になりました!
次は何をすればいいですか?
yoko先生
yoko先生
そうですね、登録くん。

さあ、最終段階ですよ!
見本と同じように、順位を多い順に並べていきましょう。
「総数」「男」「女」それぞれを多い順に表示したあと、ピボットの外で表をまとめていきます!

  1. 「総数」を多い順に並び替える方法
  2. 「全部位」を非表示にする方法
  3. 「結腸」と「直腸」を非表示にする方法
  4. 「上皮内がん」を非表示にする方法

①「総数」を多い順に並び替える方法

がん罹患数の多い順に並べ替えると、どの部位が多いか一目でわかります。では、さっそく操作してみましょう。

手順

  • 「総数」列のセルを選択します
  • 右クリックで「並び替え」を選択
  • 「降順」を選択することで多い順になります

上図のように、「総数」列を降順に並び替えると、上から罹患数の多い順に並んで表示されます。

登録くん
登録くん
「こうじゅん」って言葉、よく聞きますけど…どういう意味ですか?
yoko先生
yoko先生
簡単に言うと、「降順」は多い順と覚えておくと便利です。
がん罹患数の順位を確認するときによく使いますので、しっかり覚えておきましょう。
登録くん
登録くん
はい、先生。

②「全部位」を非表示にする方法

登録くん
登録くん
yoko先生、ピボットテーブルで不要な部位を消したいです。
どうしたらいいですか?
yoko先生
yoko先生
それなら、『部位』のフィルター機能を使うと簡単ですよ。
見たくない行を非表示にできます。
登録くん
登録くん
なるほど!フィルターで不要な行を非表示にしていけばいいんですね。

多い順に並べると、「全部位」が一番上に表示されます。これは、すべての合計のことですので、一番多くて当然ですね。件数もケタ外れです。各部位で比較したいので、今回は非表示にしましょう。

手順

  • 「部位」セルの右側にある フィルター機能 を開く
  • 部位の一覧から「全部位」チェックボックスを外す

上図のように、「部位」セルに右側にあるフィルター機能を開きます。部位の一覧の中から「全部位」のチェックボックスを外しましょう。

③「結腸」と「直腸」を非表示にする方法

がん登録では、「結腸」と「直腸」をあわせて「大腸」というカテゴリーで集計します「最新がん統計」の表では、「大腸」のカテゴリーを使用しています。ですので、今回は「結腸」と「直腸」も非表示にしていきます。

手順

  • 「部位」セルの右側にある フィルター機能 を開く
  • 部位の一覧から「結腸」「結腸(上皮内がん含む)」チェックボックスを外す

上図のように、「部位」セルに右側にあるフィルター機能を開きます。部位の一覧の中から「結腸」と「結腸(上皮内がん含む)」のチェックボックスを外しましょう。

同様に、「直腸」と「直腸(上皮内がん含む)」のチェックボックスを外しましょう。

手順

  • 「部位」セルの右側にある フィルター機能 を開く
  • 部位の一覧から「直腸」「直腸(上皮内がん含む)」チェックボックスを外す

④「上皮内がん」を非表示にする方法

登録くん
登録くん
同じ部位なのに「上皮内がん含む」って書いてあるものがありますね。
これは何ですか?
yoko先生
yoko先生
上皮内がん」というのは、上皮(上の皮)にとどまるがんのことです。
皮膚の表面にとどまっている状態と理解してよいです。
「浸潤がん」と区別され、集計から除外されることもあります。

「最新がん統計」では、「上皮内」を含めないで表を作成されています。ここでも「最新がん統計」に合わせて、「上皮内」を表示しないようにしましょう。

手順

  • 「ラベルフィルター」を選択
  • 「指定の値を含まない」を選択
  • 「上皮内」と入力

上図のように、「部位」セルに右側にあるフィルター機能を開きます。ラベルフィルターをクリックし、指定の値を含まないを選択しましょう。すると、小ウィンドウが開きます。ここに「上皮内」と入力すると、一覧からその文字を含むデータが自動で外れます。

登録くん
登録くん
先生、Excelのラベルフィルターって何ですか?
使ったことがなくて、よくわかりません…。
yoko先生
yoko先生
Excelのラベルフィルターは、データを条件に合わせて絞り込む機能です。
文字列の一致・不一致や特定のパターンなど、さまざまな条件で必要な情報だけを簡単に確認できます。

並び替え・フィルター手順のまとめ

これまで、4つの手順をやってきました。

  1. 「総数」を降順に並び替え
  2. 「全部位」を非表示
  3. 「結腸」・「直腸」を非表示
  4. 「上皮内」を非表示

今の段階では、「総数」が多い順に並んでいます。左側の部位はその多い順の部位に並んでいます。ピボットテーブルを使ったことある人は、同様に「男」列や「女」列も多い順に並び替えることができるでしょう。「最新がん統計」の表と見比べて表記と同じ順になっていることをご確認ください。

がん統計データは忘れずに保存しましょう

一度ここでエクセルファイルを保存しましょう。名前を変えて保存することをお勧めします。

次の記事では表を作成していきましょう

登録くん
登録くん
うわぁ、すごい集中しました。大変だったけど、みるみる形が見やすくなって、楽しかったです!
「総数」を多い順に並べて、必要な部位に絞り込むと、こんなに見やすくなるんですね!
yoko先生
yoko先生
登録くん、よくがんばりましたね。
そうですね、大量のデータから、知りたい情報の形にできましたね!
次の記事では、ここで作ったピボットテーブルから、必要な情報を自分で取り出す方法を確認していきましょう。

ここで作ったピボットテーブルを利用して表を作りましょう。国立がん研究センター「最新がん統計」を見本にして、罹患の多い順で表示していきます。

【4.】あとはExcelでコピペ!がんの多い順 でご説明いたします。

応援よろしくお願いします!
がん統計ブログ|にほんブログ村プロフィールページへ