Microsoft Excelで作成したデータセットをCSV形式で保存する
Microsoft Excelで作成したデータベースは、その保存のタイミングでCSV形式に変換することができます。CSV形式ではデータがテキストとして保存されます。文字の色やセルの背景、大きさなどの情報はすべて消されてしまいますが、Rではそもそもこれらの情報を使いませんから問題はありません。また、CSV形式は、アプリケーションを問わずにデータをやりとりできる、Excelのバージョンアップなどで閲覧・使用ができなくなるおそれがないといったメリットがあります。複数の人でデータを共有する場合や、長期間にわたってデータを使用したい(再利用の可能性がある)場合は、データセットをCSV形式で保存したうえで利用するのが良いでしょう。
また、この変換のタイミングで、エンコードの変更を行うこともできます。少し古いWindowsではShift JISでエンコードされるケースもありますので、後々そのデータを再利用することを考えると、このタイミングでUTF-8形式に変換しておいた方が良いでしょう。
保存の方法は次の通りです。
- ファイル>名前を付けて保存
- 保存形式をからExcel ブック (*.xlsx)からCSV UTF-8 (コンマ区切り)にする
- 保存
なお、CSV形式では、Excelのように複数のシートを1つのファイルにまとめるという考え方がありません。1つのファイルに複数のシートを作成している場合は、シートごとに別の名前を付けてCSVファイルを作成しましょう。
保存したCSV形式のファイルは、Rの作業用フォルダ(RStudioのGlobal Optionsで設定した場所)に移動させておいた方が良いでしょう。RStudio上でもフォルダ・ファイルの指定はできますが、RStudioに慣れないうちは、できるかぎりRStudio上で行う作業を少なくしておいた方が負担感は少なくなります。
CSVファイルをRStudioに取り込む
データセットを取り込む
RStudioでは画面が上下・左右に2分割ずつ、合計4つに分割されており、その1つ1つをペインといいます。ファイルを取り込むにあたっては、このうち右下のペインを使います。
右下のペインには、その上部にFiles、Plots、Packages、Help、Viewer、Presentationの6つのタブが並んでいますが、データセットの取り込みは、一番左のFilesのタブで行います。Filesのタブを選択すると、フォルダに保存されているファイルが列挙されるはずです。このなかからRStudioに取り込みたいデータセットが保存されているファイルを見つけてください。
ファイルが見つかったら、次のステップでデータセットを取り込みます。
- ファイル名を左クリックする
- 出てきたメニューのなかからImport Datasetを選択する
この方法でファイルの情報を取り込んだ場合、RStudio上でのデータセットの名前はCSVファイル名と同じになります(拡張子.csvは取り除かれます)。RStudioでは、作業を行う際にデータセットの名前を指定する場面が数多く現れますが、その場合
もちろんコンソールペインにコードを打ち込むことでも取り込みを行うことができますし、取り込みにあたって細かい設定をすることもできますが、まずは簡便な方法で読み込んで、細かい設定については少しずつ慣れていけばよいのではないでしょうか。
変数名をそのまま使えるようにattachしておく
RStudioで統計処理やグラフの作成を行うときは、データセットの名前だけでなく、データセットに登録された変数を指定する必要があります。しかし、データセットを取り込んだだけでは、元のExcelファイル上で設定した変数名をそのまま使うことができません。
そこで、コンソールペインに次のように入力して、変数名を使用できるようにしておきます。
attach(データセットの名前)
コメント