仕事効率化

【エクセル】練習用のデータの作成方法とは?(疑似個人情報と乱数)

エクセルで練習用データが必要なとき、あなたはどうしていますか?

初めて利用する関数の学習や、作成したマクロの検証など、エクセルでダミーデータが欲しくなることはよくありますよね。

ナル
ナル
僕はブログでエクセルの解説をするために、その都度練習用データを準備しています。

しかし、架空の氏名や住所を考えながら名簿を作成する、売上金額にランダムな数値を入力する、という作業はなかなか面倒。

だからと言って、本物の社員名簿や売上実績のデータを流用するのは情報漏洩のリスクもあり非常に危険

そこで本記事では、エクセルでデタラメな練習用データ(名簿・数値)を簡単に準備できる方法をご紹介します!

エクセルの練習用データは疑似個人情報生成サイトと関数で準備できる!

架空の個人情報データを生成できるサイト(ツール)を利用すれば、面倒な作業は一切なしで練習用・検証データを用意することができます。

その代表的なサイトが疑似個人情報データ生成サービス

ナル
ナル
Microsoft Excel(エクセル)形式で出力できるため、すぐに利用可。

但し、機械的に抽出したデータが、偶然実在する氏名、住所、電話番号になってしまう確率はゼロではありません。

ダミーデータではありますが、取り扱いには注意してください。
スポンサーリンク


エクセルの練習用データに疑似個人情報を利用する理由

エクセルでテストや検証で、疑似個人情報データ生成サービスの利用をおすすめするメリットをお伝えします。

エクセルの練習用データに疑似個人情報を利用するメリット①架空のデータで安心

架空の個人情報
2005年4月に施行された個人情報保護法により、個人情報のデータの取り扱いについての取り決めが厳しくなっています。

収集した個人情報データを、目的以外のことに利用してはいけないということですね。

大企業で個人情報の漏洩などが報道されているのを、あなたも一度はご覧になったことがありませんか?

実在する顧客リストで練習用・検証して、そのデータを誤って社外に流出させてしまったら、企業の責任を問われてしまいます

自分の氏名・住所・電話番号・生年月日・血液型・職業・年収…。

ナル
ナル
個人情報が、どこの誰かもわからない人たちに知られてしまうのは恐ろしいし、もしそうなったとしたら絶対に許せません。

そうしたリスクを回避するためにも、エクセルの練習用・検証には疑似個人情報データ生成サービスを積極的に使用するのが安心安全です。
スポンサーリンク



エクセルの練習用データに疑似個人情報を利用するメリット②大量のデータを作成

大量の作業
架空の氏名や住所を入力すると言っても、数件のデータであれば手作業でもそれほど大変ではありませんよね。

でも、必要な名簿の練習用データが数百件、数千件もあるとしたらどうしますか?

ナル
ナル
手入力でデータを用意するのはムリ!
架空の名前もそんなに思いつかない…。

たとえば疑似個人情報データ生成サービスなら、最大で5,000件のダミーデータを1度に出力することができます。

エクセルの練習用・検証で使うデータなら、それだけあれば十分足りそうですよね。

それに、疑似個人情報データ生成サービスで抽出したデータは表頭も罫線も含まれていますから、加工する手間もほとんど必要としません。

疑似個人情報データ生成サービスを利用すれば、デタラメなデータが作成できるだけでなく、大幅な作業時間の短縮効果も期待できます。
スポンサーリンク


エクセルの練習用データに疑似個人情報を利用するメリット③条件を指定して抽出

データの条件指定
名簿に含まれる個人情報は氏名や住所だけでなく、メールアドレス、血液型、出身地など、項目がたくさんありますよね。

それらを、すべて自分で考えて偽データを入力するのは至難の業。

疑似個人情報データ生成サービスでは、デフォルトで多くの項目が設定されています。

生成できるデータ項目

連番、氏名、性別、電話番号、メールアドレス、住所、生年月日、年齢、出身地、血液型、乱数、パスワード

なんと12項目の情報をボタン1で出力することが可能で、年齢の範囲や男女比率、住所範囲を条件指定するオプション機能も有り。

ナル
ナル
ちなみに血液型はA型が38%、B型が22%、O型が31%、AB型が9%という日本人の血液型の割合に合わせたデータが出力されるようになっています。

指定した範囲内の数値を出力できる乱数もかなり便利。

売上金額とか販売実績などのダミーデータも一緒に出力すれば、すぐにエクセルの練習用・検証をはじめられます。

もし、生成したデータ内容が気に入らない場合には、再生成ボタンで作り直すこともできるのも良いですね。
スポンサーリンク



疑似個人情報データ生成サービスでエクセルの練習用データを出力する方法とは?

実際の画面をお見せしながら、疑似個人情報データ生成サービスの利用手順をご紹介します。

疑似個人情報データ生成サービスにアクセスして、「生成を開始する」をクリック。
生成を開始する
生成項目の項目をご覧ください。
チェックボックスを確認
ここでチェックボックスにレ点が入っているデータのみが生成されます。

ナル
ナル
項目によっては、条件を細かく指定できるものもあるのでお好みに合わせて設定してください。

たとえば、「姓と名の区切り」は、「半角スペース」、「全角スペース」、「姓と名を別の項目として出力」が選べます。

性別の表示も変更可。

「男/女」がデフォルトですが、ちょっと表現が気になるので僕はいつも「男性/女性」に変更しています。

他の項目も必要に応じて調整すればOK。

必要に応じて、生成条件(オプション)も設定しましょう。
オプションの設定
画面最上部にある「生成」を押して次の画面へ進みます。

下にスライドすると、ダミーデータが生成されているはず。
ダミーのデータ
内容に問題がなければ、「Microsoft Excel」にチェックをしてダウンロード。
データのダウンロード
任意の場所に保存したファイルを開きます。
保存したファイルを開く

「ファイル形式と拡張子が一致しません。ファイルが破損しているか、安全ではない可能性があります。発行元が信頼できない場合は、このファイルを開かないでください。ファイルを開きますか?」

と、表示される場合には、「はい」を選択。
警告が出たら「はい」
保護ビューで、下記の警告が出ることもあります。

「インターネットから入手したファイルは、ウイルスに感染している可能性があります。編集する必要がなければ、保護ビューのままにしておきことをお勧めします。」

こちらも気にせずに「編集を有効にする」をクリック。
編集を有効にする
これで、すぐにエクセルの練習用・検証に利用できます。
練習用データの完成

スポンサーリンク


なんちゃって個人情報で疑似個人情報を出力する方法

疑似個人情報データ生成サービスの他にも、「なんちゃって個人情報」というダミーデータを作成できるサイトがあります。
なんちゃって個人情報

なんちゃって個人情報の出力項目

名前、ふりがな、メールアドレス、性別、年齢、誕生日、婚姻、血液型、都道府県、電話番号、携帯、キャリア、カレーの食べ方

なんちゃって個人情報の項目
出力形式はCSV、出力数に任意の数字を入力します。

なんちゃって個人情報はエクセル形式でデータ出力ができません。

エクセル形式で出力不可
なんちゃって生成ボタンをクリック。
なんちゃって生成ボタン
ダウンロードが完了したらフォルダを開く。
フォルダを開く
疑似個人情報生成サービスと異なり、なんちゃって個人情報で出力したデータはそのままエクセルで利用することができません

ファイルを右クリックして「名前の変更」。
名前の変更

ナル
ナル
ちょっと面倒ですが、ファイルの拡張子を「csv」に変更する必要があります。

「拡張子を変更すると、ファイルが使えなくなる可能性があります。変更しますか?」と表示されたら「はい」。
気にせず「はい」
ファイルのアイコンがエクセルに変わります。
エクセルのアイコンに変更される
これでエクセルの練習用データとして利用できます。
エクセルの練習用として使える
編集後に保存をするときにはファイルの種類を「Excel ブック」にしてください。
保存するときはエクセル形式にする
なんちゃって個人情報では、疑似婚情報データ生成サービスでは出力されない項目のデータもあるため、必要に応じて使い分けてください。

ダウンロードしたファイルの名前を変更するなど、手間が少し多いのが難点ですが便利なサイトです。
スポンサーリンク



エクセル関数で乱数を入力する方法

疑似個人情報生成サービスは個人情報と同時に乱数を出力してくれますが、なんちゃって個人情報の場合、データにそのような項目はありません。

その為、テストの点数や売上金額など、ランダムな数値を練習用・検証で利用したい場合には別途作成する必要があります。
乱数は別途作成する
しかし、乱数だけ手入力するというのも手間になるので、補足として乱数を簡単に生成できるエクセル関数を紹介。

RANDBETWEEN関数で整数の乱数を作成

例として、なんちゃって個人情報で生成したデータのC列に売上金額という項目をつくり、ランダムな数値を入力します。

エクセルのfxボタンをクリック。
エクセルのfxボタン
関数の挿入ダイアログボックスが表示されたら関数の分類を「数学/三角」に切り替えて、一覧からRANDBETWEEN関数を探します。
RANDBETWEEN関数
関数の引数として入力するのは最小値と最大値。

ナル
ナル
あなたが利用したい数値に合わせて設定してください。

ここでは例ととして、最小値を0、最大値を10,000と指定。
最小値と最大値
C2セルに「=RANDBETWEEN(0,10000)」いうエクセル関数が入力され、自動的に乱数が表示されました。
乱数の作成に成功
C2セルの数式をC6セルまでコピーすると、それぞれのセルに乱数が表示。
数式をコピーする
もし表示されている乱数に偏りがある、バランスが悪いなど、乱数を作り直したいときにはキーボードのF9キーをポチッとしてください。

F9キーを押す度に乱数が再生成されます。
F9キーで再計算
練習用・検証で利用できる乱数が作成できたら、データを範囲選択してコピー。
データ範囲をコピー
同じ場所に「値の貼り付け」します。
値の貼り付け
この処理を行うことで、C列に入力されていたRANDBETWEEN関数が消えました。
セルの関数が消える
「値の貼り付け」をしないと、キーボードのEnterキーを押す度にRANDBETWEEN関数の入力されているセルが再計算されてしまうので注意。
スポンサーリンク


RAND関数で0以上1以下の乱数を作成

RANDBETWEEN関数を利用すれば整数の乱数を生成できますが、練習用・検証用のデータでは小数点を含む数値が欲しいときもありますよね。

その場合には、RANDBETWEEN関数ではなくRAND関数を利用すれば解決。
RAND関数
RAND関数は引数の入力画面もなく、OKをクリックするだけで完了です。
RAND関数は引数なし
小数点を含む0以上1以下の数値を作成できました。
0以上1以下の乱数を生成
RAND関数もキーボードのF9キーを押す度に数値を再生成してくれます。
スポンサーリンク



エクセルで個人情報データの一部を伏せ字にする方法

でたらめの内容の疑似個人情報データでも、印刷した資料を第三者に見せるのは抵抗があるという方もいるでしょう。

エクセル関数を利用すれば、たとえば氏名の一部分のみを「*」などの伏せ字にすることができるのでやり方をご説明しておきます。

エクセルで個人情報データの一部を伏せ字にする方法①REPLACE関数

例として、下記データのB列に入力された氏名の2番目の文字を、エクセルのREPLACE関数で「*」に変換します。

REPLACEは、指定した位置の文字を任意の文字に置き換えることができるエクセル関数です。
文字を伏せ字にしたい
C列を挿入してC2セルを選択したら、fx(関数の挿入)ボタン。
関数の挿入
関数の挿入ダイアログボックスが表示されたら、関数の分類を「文字列操作」に変更。

一覧からREPLACE関数を選択します。
REPLACE関数
関数の引数は「文字列」、「開始位置」、「文字数」、「置換文字列」の4つ。
REPLACE関数の引数は4つ
引数が多いとむずかしく見えるかもしれませんが、考え方はとてもシンプルです。

文字列:B2

対象の文字列データが入力されているセルを指定します。

この例の場合だと「高橋重義」と表示されているB2セルですね。

開始位置:2

「文字列」の引数で指定したデータの何番目を置き換えるかという意味です。

氏名の2文字目を変換したいため2を入力。

文字数:1

REPLACE関数は複数の文字を同時に別の文字に置き換えることができます。

「文字数」の引数では、「開始位置」から何文字を置き換えしたいかを入力。

今回は氏名の2文字目だけを伏せ字にしたいので1でOKです。

置換文字列:”*”

指定した位置の文字を置き換えする文字列です。

「*」にしたいなら、「*」と入力するだけ。

4つの引数を入力すると、下図のようになります。

確認してOKをクリック。
引数を入力
C2セルに「=REPLACE(B2,2,1,”*”)」という式が入り、氏名の2文字目だけが「*」に置換されました。

数式を他のセルにもコピーします。
数式を他のセルにもコピー
どれも氏名の2番目のみが伏せ字になりましたね。

個人情報を扱うときは、REPLACE関数を利用するとより安全にデータを利用できます。

名簿管理でも使えるかもしれません。

エクセルで名簿管理!混在したデータ表記を統一する方法とは?エクセルで名簿を作成すると、半角と全角、大文字と小文字、ひらがなとカタカナなど、表記が混在してしまうとデータ管理をするのに不便です。関数や書式設定を利用して統一表記に変換しましょう。...

スポンサーリンク


エクセルで個人情報データの一部を伏せ字にする方法②REPLACEとRANDBETWEEN

ついでにREPLACE関数で伏せ字にする文字列の位置をランダムにする方法をオマケで紹介しておきます。

勘の鋭い方はお気づきかもしれませんが、REPLACE関数の引数にRANDBETWEEN関数を組み合わせる方法です。

先ほどREPLACE関数で伏せ字にしたC2セルを選択して、fx(関数の挿入)ボタン。
REPLACE関数が入力されたセルを選択
引数「開始位置」を「RANDBETWEEN(1,4)」に変更。

こうすることで、REPLACE関数の開始位置を1~4の整数でランダムに設定できます。
引数にRANDBETWEEN関数を利用する
C2セルが「=REPLACE(B2,RANDBETWEEN(1,4),1,”*”)」という式になり、他のセルにコピーすると氏名の伏せ字の位置がバラバラになりました。
伏せ字の位置がバラバラになる
あまり活用する機会はありませんが、エクセルは関数の組み合わせでできることが増えるので覚えておくと便利です。
スポンサーリンク



まとめ

エクセルで練習用や検証をするためのダミーデータの作成方法をご紹介しました。

数値だけのデータが欲しいなら、RANDBETWEEN関数とRAND関数だけで解決できるケースもあるでしょう。

ナル
ナル
名簿データが必要な場合、おすすめは疑似個人情報生成サービスですが、好みに合わせてなんちゃって個人情報も利用すると良いかも。

ダミーとは言え、くれぐれも個人情報の取り扱いにはご注意くださいね。
スポンサーリンク