CSVファイルとは?使い方やExcelファイルとの違いについて解説
こんにちは、営業担当の藤川です。
今回は【IT超入門編】として、「CSVとは?」をお届けしたいと思います。
目次[非表示]
CSVとは
CSVとは、「Comma Separated Values(カンマ セパレーティド ヴァリューズ)」の略で、各項目間がカンマ(,)で区切られたデータのことです。
直訳すると「カンマで値を分ける」という意味になります。
このCSVのデータは、下記図のようにテキスト(文字)とカンマ(,)で構成されています。
これらのデータをまとめたものを、「CSVデータ」といいます。
CSVデータについて下記図を使いながら、詳しく説明していきます。
Aさんの情報である「住所」「名前」「生年月日」などの1つ1つの情報は「フィールド」といいます。
このフィールドが1つにまとまったデータ(Aさんの情報全て)を「レコード」といいます。
さらにレコードが複数格納してあるファイル(AさんからDさんまでの情報全てまとめたファイル)を「CSVファイル」といいます。
CSVとExcelの違い
一般的にCSVファイルは、Excelで表示されることが多いです。
しかしExcelの裏側では、先に説明したようにテキスト(文字)とカンマ(,)だけのデータが記載されているのです。
ここで、「CSVとExcelって一緒なの?」と思われた方もいらっしゃるのではないでしょうか?
CSVデータはテキスト(文字)とカンマ(,)だけで構成されていますが、私たちからすると凄く読みづらいデータになっています。
そこでExcelなど異なる形式でそのCSVデータを読み込み、表示することで「読みやすく」かつ「活用しやすい形」にしているのです。
※CSVデータをExcelで表示した例
このようにExcelなどの他のアプリケーションで、CSVデータなどの異なる形式のデータを読み込むことを「インポート」といいます。
このインポートしたデータと、一般のExcelを見分けるには「拡張子」を見てみてください。
※左:Excel形式でインポートしたCSVファイル 右:一般的なExcelファイル
拡張子は「.◯◯◯」で表示され、ファイル名の後ろに付いています。
「▲▲さんの情報.csv」とファイル名が表示されているものはCSVデータをインポートしたファイルということになります。
CSVファイルの記法
CSVファイルはテキストエディタさえあれば誰でも簡単に作成・編集することができます。
CSVファイルの記法としては次の通りになります。
ヘッダ行
前項で、CSVファイルは、「各項目間がカンマ(,)で区切られたデータ」であるとお伝えしましたが、ヘッダ行は、先頭に記載される区切られたデータの項目名やタイトルが記された行を指します。
上図の場合、「住所,名前,生年月日,性別,電話番号」の部分にあたります。
ヘッダ行は、各列のデータ内容を利用者が認識していれば、記載する必要はないため、先頭行から以下のようにデータを記載しても問題ありません。
区切り文字
各行に続けて記載されているデータを区切るための文字を「区切り文字」と言い、CSVの場合はカンマ(,)区切りとなります。
カンマ区切りで作られるCSV以外にも、似たものとして以下があります。
- タブ区切り:TSV(tab separated values)
- 半角スペース区切り:SSV(space separated values)
- セミコロン区切り:SSV(semicolon separated values)
これらをまとめて 「character-separated values、delimiter-separated values」とも呼びます。
改行コード
各行に記載されているデータの終了には「改行(改行コード)」が必要です。
普段何気なく使用している改行ですが、「CRLF」、「CR」、「LF」の3種類の改行コードが存在します。
改行コードは使用するOSによって異なり、一般的にWindowsは「CRLF」、macOS(9以前)は「CR」macOS(9以降)、Linuxは「LF」を使用します。
うまくテキストデータを開けられない、想定外の動きをする場合は、改行コードがうまく認識できておらず、データの終了が識別できなくなっている可能性があります。
そのため、異なるOSでデータ変換をおこなう場合は注意が必要です。
ダブルクォート
CSVファイルで区切ったデータの中に、カンマ(,)、改行(、)、ダブルクォート(")といった「制御文字」を含む場合は、対象のデータをダブルクォート(")で囲む必要があります。
どのような場合にCSVを使うのか?
CSVファイルは主に以下のような場合に利用します。
- 基幹システムへのアップロードやダウンロード
- データベースへのインポートやエクスポート
- MAツールやBIツールなどアプリとのデータ連携
- ファイルのデータ容量を軽くする
- 統計情報などのビックデータ分析用データセットをCSVで配布
基本的に、データベースや基幹システム等においては、Excelファイルと互換性がないため、Excelで作った表はCSVファイルに変換して読み込む必要があります。
また、データベースや基幹システム側でもExcelとして出力できないため、CSVファイルとして出力し、Excelに読み込ませ表示させています。
CSVがこのように様々な場面で利用されている理由の1つには、装飾や機能が省かれることによってデータ容量が軽くなるという特徴があります。
データをたくさん入れても容量が大きくなりにくいため、データの作成やダウンロードに時間がかからないCSVは重宝されており、多様な場面で活用されています。
どのような場合にExcelを使うのか?
Excelファイルは主に以下のような場合に利用します。
- 表計算といったデータの集計や分析
- 作成したレポートをそのまま活用したい場合
- 印刷設定が重要な場合
基本的に、Excelファイルを用いる時は、Excelデータと互換性のあるソフトだけでデータの編集・閲覧が完結する場合です。その場合は集計や分析がおこなえるExcelデータをそのまま使った方が便利です。
CSV利用時の注意点
CSVファイルをExcelで開く際に元のデータが変わってしまう場合があります。
これは、Excelが勝手に日付のような見た目のデータを日付として扱ってしまうことがあるためです。
主に以下のような問題がよく挙げられます。
番地や数列が日付に変換されてしまう
こちらはアンケートフォームや顧客データなどでよく発生する現象です。
「2021-7-7」といった数列や番地の「1-7-7」といった記述が「2021/7/7」というように日付に変更されてしまいます。
「年/月」が「英語の月-年の下2桁」の書式に変更されてしまう
こちらも日付に関連した現象です。
「2021/5」といった年月の記述があった場合、「Jun-21」のように変換されてしまいます。
数列の頭の「0」が消えてしまう
例えば「0312345678」といった電話番号など、数列の頭が「0」であるデータはCSVからExcelにファイルをインポートすることで消されてしまう場合があります。
一般に「0落ち」などと呼ばれます。
カッコつきの数がマイナスの数に変換されてしまう
「(1)」など、カッコつきの文字が「-1」に変換されてしまいます。
これは、欧米の財務諸表では、マイナスの数値を括弧で囲むというルールがあることが要因になっています。
CSVでデータが変わってしまった時の対処方法
では、これらの問題はどのように対処したら良いのでしょうか。
対処法をご紹介します。(※Windowsの場合)
【1】CSVファイルをメモやテキストエディタで開きます。
【2】内容を全てコピーします。
【3】 Excelを起動し、空白のブック(新規ファイル)に貼り付けをおこないます。
【4】1列目を選択した状態で、「データ」メニューの「区切り位置」をクリックします。
【5】「カンマやタブなどの区切り文字によってフィールドごとに区切られたデータ」を選択し、「次へ」をクリックします。
【6】区切り文字にて「コンマ」を選び、「次へ」をクリックします。
【7】列ごとに「列のデータ形式」 を指定することができます。
必要に応じで 「データのプレビュー」で列を選択しながら、形式を指定します。
ここで、住所や電話番号など変換されたくない項目で「文字列」を選ぶことによってデータの変換を防ぐことが可能です。
「完了」をクリックすると、データが変換されずにCSVが正しく表示されます。
アララではどのように使われているのか
では実際に、アララでは「CSVファイル」をどのように使用しているのかお伝えします。
現在アララでは、主に2通りの使い方をしています。
- CSVファイルを用いて、配信リストやユーザ属性をシステム側に簡単登録できる
(自動で行うことも可能です) - メールの効果測定結果をCSVで出力できる
①CSVファイルを用いて、配信リストやユーザ属性をシステム側に簡単登録できる
こちらはメール配信サービス「アララ メッセージ」の機能の1つです。
方法としては、アララ メッセージからのCSVテンプレートをダウンロードし、そこに顧客情報を入力後、アララ メッセージにインポートします。
これで登録完了です。
➁メールの効果測定結果をCSVで出力できる
こちらもアララのメール配信サービス「アララ メッセージ」の機能の1つで、「配信したメールは、どのぐらい開封されているのか」「メールに記載しているURLがどのぐらいクリックされているのか」などを見ることが可能です。
まとめ
今回のコラムで、「CSV」の特徴や使われ方、注意点などご理解いただけましたでしょうか。
次回も、みなさまにお役立ていただけるようなコラムを配信してまいります。
また、メール配信に関してお悩みなどございましたらお気軽にお問い合わせください。
関連コラム