
CSVファイルとは?Excelファイルとの違いについて
こんにちは、営業担当の藤川です。
今回は【IT超入門編】として、「CSVとは?」をお届けしたいと思います。
目次[非表示]
CSVとは
CSVとは、「Comma Separated Values(カンマ セパレーティド ヴァリューズ)」の略で、各項目間がカンマ(,)で区切られたデータのことです。
直訳すると「カンマで値を分ける」という意味になります。
このCSVのデータは、下記図のようにテキスト(文字)とカンマ(,)で構成されています。
これらのデータをまとめたものを、「CSVデータ」といいます。
CSVデータについて下記図を使いながら、詳しく説明していきます。
Aさんの情報である「住所」「名前」「生年月日」などの1つ1つの情報は「フィールド」といいます。
このフィールドが1つにまとまったデータ(Aさんの情報全て)を「レコード」といいます。
さらにレコードが複数格納してあるファイル(AさんからDさんまでの情報全てまとめたファイル)を「CSVファイル」といいます。
一般的にCSVファイルは、Excelで表示されることが多いです。
しかしExcelの裏側では、最初の図のようにテキスト(文字)とカンマ(,)だけのデータが記載されているのです。
ここで、「CSVとExcelって一緒なの?」と思われた方もいらっしゃるのではないでしょうか?
こちらについては次の項目で、詳しく解説していきます。
CSVとExcelの違い
CSVデータはテキスト(文字)とカンマ(,)だけで構成されていますが、私たちからすると凄く読みづらいデータになっています。
そこでExcelなど異なる形式でそのCSVデータを読み込み、表示することで「読みやすく」かつ「活用しやすい形」にしているのです。
※CSVデータをExcelで表示した例
このようにExcelなどの他のアプリケーションで、CSVデータなどの異なる形式のデータを読み込むことを「インポート」といいます。
このインポートしたデータと、一般のExcelを見分けるには「拡張子」を見てみてください。
※左:Excel形式でインポートしたCSVファイル 右:一般的なExcelファイル
拡張子は「.◯◯◯」で表示され、ファイル名の後ろに付いています。
「▲▲さんの情報.csv」とファイル名が表示されているものはCSVデータをインポートしたファイルということになります。
どのような場合にCSVを使うのか?
CSVファイルは主に以下のような場合に利用します。
- 基幹システムへのアップロードやダウンロード
- データベースへのインポートやエクスポート
- MAツールやBIツールなどアプリとのデータ連携
- ファイルのデータ容量を軽くする
- 統計情報などのビックデータ分析用データセットをCSVで配布
基本的に、データベースや基幹システム等においては、Excelファイルと互換性がないため、Excelで作った表はCSVファイルに変換して読み込む必要があります。
また、データベースや基幹システム側でもExcelとして出力できないため、CSVファイルとして出力し、Excelに読み込ませ表示させています。
CSVがこのように様々な場面で利用されている理由の1つには、装飾や機能が省かれることによってデータ容量が軽くなるという特徴があります。
データをたくさん入れても容量が大きくなりにくいため、データの作成やダウンロードに時間がかからないCSVは重宝されており、多様な場面で活用されています。
アララではどのように使われているのか
では実際に、アララでは「CSVファイル」をどのように使用しているのかお伝えします。
現在アララでは、主に2通りの使い方をしています。
- CSVファイルを用いて、配信リストやユーザ属性をシステム側に簡単登録できる
(自動で行うことも可能です) - メールの効果測定結果をCSVで出力できる
①CSVファイルを用いて、配信リストやユーザ属性をシステム側に簡単登録できる
こちらはメール配信サービス「アララ メッセージ」の機能の1つです。
方法としては、アララ メッセージからのCSVテンプレートをダウンロードし、そこに顧客情報を入力後、アララ メッセージにインポートします。
これで登録完了です。
➁メールの効果測定結果をCSVで出力できる
こちらもアララのメール配信サービス「アララ メッセージ」の機能の1つで、「配信したメールは、どのぐらい開封されているのか」「メールに記載しているURLがどのぐらいクリックされているのか」などを見ることが可能です。
CSV利用時の注意点
CSVファイルをExcelで開く際に元のデータが変わってしまう場合があります。
これは、Excelが勝手に日付のような見た目のデータを日付として扱ってしまうことがあるためです。
主に以下のような問題がよく挙げられます。
番地や数列が日付に変換されてしまう
こちらはアンケートフォームや顧客データなどでよく発生する現象です。
「2021-7-7」といった数列や番地の「1-7-7」といった記述が「2021/7/7」というように日付に変更されてしまいます。
「年/月」が「英語の月-年の下2桁」の書式に変更されてしまう
こちらも日付に関連した現象です。
「2021/5」といった年月の記述があった場合、「Jun-21」のように変換されてしまいます。
数列の頭の「0」が消えてしまう
例えば「0312345678」といった電話番号など、数列の頭が「0」であるデータはCSVからExcelにファイルをインポートすることで消されてしまう場合があります。
一般に「0落ち」などと呼ばれます。
カッコつきの数がマイナスの数に変換されてしまう
「(1)」など、カッコつきの文字が「-1」に変換されてしまいます。
これは、欧米の財務諸表では、マイナスの数値を括弧で囲むというルールがあることが要因になっています。
CSVでデータが変わってしまった時の対処方法
では、これらの問題はどのように対処したら良いのでしょうか。
対処法をご紹介します。(※Windowsの場合)
【1】CSVファイルをメモやテキストエディタで開きます。
【2】内容を全てコピーします。
【3】 Excelを起動し、空白のブック(新規ファイル)に貼り付けをおこないます。
【4】1列目を選択した状態で、「データ」メニューの「区切り位置」をクリックします。
【5】「カンマやタブなどの区切り文字によってフィールドごとに区切られたデータ」を選択し、「次へ」をクリックします。
【6】区切り文字にて「コンマ」を選び、「次へ」をクリックします。
【7】列ごとに「列のデータ形式」 を指定することができます。
必要に応じで 「データのプレビュー」で列を選択しながら、形式を指定します。
ここで、住所や電話番号など変換されたくない項目で「文字列」を選ぶことによってデータの変換を防ぐことが可能です。
「完了」をクリックすると、データが変換されずにCSVが正しく表示されます。
まとめ
今回のコラムで、「CSV」の特徴や使われ方、注意点などご理解いただけましたでしょうか。
次回も、みなさまにお役立ていただけるようなコラムを配信してまいります。
また、メール配信に関してお悩みなどございましたらお気軽にお問い合わせください。
関連コラム