登録くんと一緒に、国立がん研究センター『がん情報サービス』の公開データを図解でやさしく学ぶ「やさしいがん統計ガイド(Easy Cancer Analytics Guide)」のホーム画像です。 Learn with Touroku-kun about public data from the National Cancer Center’s Cancer Information Service, explained gently with illustrations in the Easy Cancer Analytics Guide homepage image.
院内がん登録シリーズ

【6】Excelで整えて分析しやすくしよう

ダウンロードした院内がん登録のCSVデータを、Excelで分析しやすい形に整えていきます。今回は「0年集計(院内がん登録 全国集計結果閲覧システム)」から取得したデータを使います。

不要な列の削除数値の変換など、グラフ作成前に行っておくと安心な基本の整え方を解説します。手順は図解付きで、わかりやすく紹介します。

6.1 シートをコピーして「元データ」と名前を付ける

登録くん
登録くん
先生、CSVデータをダウンロードしてみたんですけど、数字じゃないところがありますね…。
yoko先生
yoko先生
そうですね。少し手直しがひつようです。
まずはシートをコピーして「元データ」と名前を付けておくと安心です。
これで、元のデータは残して、別のシートでデータを整えましょう。

作業ミスを防ぐため、元のシートをコピーしてから編集しましょう。シート名を「元データ」に変更しておくと、あとで見返すときも安心です。

登録くん
登録くん
シートを「元データ」って名前にしました!

【手順6.1】シートをコピーして「元データ」と名前を付ける

① Ctrlキーを押しながら、コピーしたいシートをドラッグ
② ドラッグ先で「シートをコピーする」マークが出ていることを確認
③ マウスを離すと、コピーしたシートが隣に作成されます
④シート名を「元データ」に変更

6.2 不要な列を削除する

登録くん
登録くん
「結腸」と「直腸」を合わせて「大腸」っていうんですよね?
この場合、「大腸」だけでいいですよね?
yoko先生
yoko先生
そうですね。
「結腸」と「直腸」の列を削除しましょう。

分析に使わない列を削除して、データを見やすく整えます。不要な情報を減らすことで、グラフ作成時のエラーを防げます。

yoko先生
yoko先生
「(うち脊髄)」は「脳神経」の一部なので、ここも重複です。
削除しましょう。

6.3 数値を区間でまとめて変換する

がん登録のデータでは、10件以下の集計値は個人が特定されないように、表記が工夫されています。「1~3」のように範囲で表記されていることがあります。
グラフを作成するためには、数値にする必要があります。ここでは、数値の変換を以下のように設定します。

・「1~3」を「1」に
・「4~6」を「4」に
・「7~9」を「7」に

元の数値変換後の数値
1~31
4~64
7~97
yoko先生
yoko先生
「置換(ちかん)」機能を使って、一気に変換していきましょう。
yoko先生
yoko先生
「置換(ちかん)」は、Ctrl+Fで「検索と置換」を開いて「置換」タブを選択しますよ。

登録くん
登録くん
「1~3」を「1」にすればいいんですね。
yoko先生
yoko先生
同じように、
・「4~6」を「4」に
・「7~9」を「7」に
やってみてくださいね。

「7~9」も「7」に置換しましょう。

登録くん
登録くん
よし!すべて数値になりました!

6.4 横棒積み上げグラフを作成する

yoko先生
yoko先生
ここまでできたら、グラフが作れます!
グラフに使う範囲だけ選択しますよ。
Ctrlキーを押しながら、選択します。
yoko先生
yoko先生
そして、
Ctrlキーを押したままで、グラフを挿入します。
選ぶグラフは、「積み上げ横棒」グラフです。

整えたデータをもとに、横棒積み上げグラフを作成します。
両方のグラフを作成してから、「拠点/以外」で分けると、全体と拠点別の傾向が比較しやすくなります。

登録くん
登録くん
先生!グラフができました!!!

6.5 まとめ

この記事では、院内がん登録データをExcelでグラフを作成する前に必要なデータ整理を行いました。

6.1 シートをコピーして「元データ」と名前を付ける
6.2 不要な列を削除する
6.3 数値を区間でまとめて変換する
6.4 横棒積み上げグラフを作成する

データから不要な列を削除し、必要な情報に整理してからグラフを作成することは、分析の基本です。

yoko先生
yoko先生
この作業を丁寧に行うことで、データの質を理解していけます。正確なデータを整えることで、意味のある情報になりますので、覚えておいてくださいね。