CSVファイルとは?使い方やExcelファイルとの違いについて解説

こんにちは、営業担当の藤川です。

今回は【IT超入門編】として、「CSVとは?」をお届けしたいと思います。


目次[非表示]

  1. 1.CSVとは
  2. 2.CSVとExcelの違い
  3. 3.CSVファイルの記法
    1. 3.1.ヘッダ行
    2. 3.2.区切り文字
    3. 3.3.改行コード
    4. 3.4.ダブルクォート
  4. 4.どのような場合にCSVを使うのか?
  5. 5.どのような場合にExcelを使うのか?
  6. 6.CSV利用時の注意点
    1. 6.1.番地や数列が日付に変換されてしまう
    2. 6.2.「年/月」が「英語の月-年の下2桁」の書式に変更されてしまう
    3. 6.3.数列の頭の「0」が消えてしまう
    4. 6.4.カッコつきの数がマイナスの数に変換されてしまう
  7. 7.CSVでデータが変わってしまった時の対処方法
  8. 8.アララではどのように使われているのか
    1. 8.1.①CSVファイルを用いて、配信リストやユーザ属性をシステム側に簡単登録できる
    2. 8.2.➁メールの効果測定結果をCSVで出力できる
  9. 9.まとめ

CSVとは

CSVとは、「Comma Separated Values(カンマ セパレーティド ヴァリューズ)」の略で、各項目間がカンマ(,)で区切られたデータのことです。

直訳すると「カンマで値を分ける」という意味になります。


このCSVのデータは、下記図のようにテキスト(文字)とカンマ(,)で構成されています。

CSVはテキスト(文字)とカンマ(,)で構成されています

これらのデータをまとめたものを、「CSVデータ」といいます。


CSVデータについて下記図を使いながら、詳しく説明していきます。

情報のレコードとフィールド

レコードが複数格納してあるファイル

Aさんの情報である「住所」「名前」「生年月日」などの1つ1つの情報は「フィールド」といいます。

このフィールドが1つにまとまったデータ(Aさんの情報全て)を「レコード」といいます。

さらにレコードが複数格納してあるファイル(AさんからDさんまでの情報全てまとめたファイル)を「CSVファイル」といいます。


CSVとExcelの違い

一般的にCSVファイルは、Excelで表示されることが多いです。

しかしExcelの裏側では、先に説明したようにテキスト(文字)とカンマ(,)だけのデータが記載されているのです。

ここで、「CSVとExcelって一緒なの?」と思われた方もいらっしゃるのではないでしょうか?


CSVデータはテキスト(文字)とカンマ(,)だけで構成されていますが、私たちからすると凄く読みづらいデータになっています。

そこでExcelなど異なる形式でそのCSVデータを読み込み、表示することで「読みやすく」かつ「活用しやすい形」にしているのです。

CSVとExcelの違い

※CSVデータをExcelで表示した例


このようにExcelなどの他のアプリケーションで、CSVデータなどの異なる形式のデータを読み込むことを「インポート」といいます。


このインポートしたデータと、一般のExcelを見分けるには「拡張子」を見てみてください。

ファイルの「拡張子」の違い


  ※左:Excel形式でインポートしたCSVファイル  右:一般的なExcelファイル



拡張子は「.◯◯◯」で表示され、ファイル名の後ろに付いています。

「▲▲さんの情報.csv」とファイル名が表示されているものはCSVデータをインポートしたファイルということになります。


CSVファイルの記法

CSVファイルはテキストエディタさえあれば誰でも簡単に作成・編集することができます。

CSVファイルの記法としては次の通りになります。


ヘッダ行

前項で、CSVファイルは、「各項目間がカンマ(,)で区切られたデータ」であるとお伝えしましたが、ヘッダ行は、先頭に記載される区切られたデータの項目名やタイトルが記された行を指します。

CSVのヘッダ行

上図の場合、「住所,名前,生年月日,性別,電話番号」の部分にあたります。

ヘッダ行は、各列のデータ内容を利用者が認識していれば、記載する必要はないため、先頭行から以下のようにデータを記載しても問題ありません。

ヘッダ行は無くても良い


区切り文字

各行に続けて記載されているデータを区切るための文字を「区切り文字」と言い、CSVの場合はカンマ(,)区切りとなります。

CSVの区切り文字

カンマ区切りで作られるCSV以外にも、似たものとして以下があります。

  • タブ区切り:TSV(tab separated values)
  • 半角スペース区切り:SSV(space separated values)
  • セミコロン区切り:SSV(semicolon separated values)

これらをまとめて 「character-separated values、delimiter-separated values」とも呼びます。


改行コード

各行に記載されているデータの終了には「改行(改行コード)」が必要です。

普段何気なく使用している改行ですが、「CRLF」、「CR」、「LF」の3種類の改行コードが存在します。

CSVの改行コード

改行コードは使用するOSによって異なり、一般的にWindowsは「CRLF」、macOS(9以前)は「CR」macOS(9以降)、Linuxは「LF」を使用します。

うまくテキストデータを開けられない、想定外の動きをする場合は、改行コードがうまく認識できておらず、データの終了が識別できなくなっている可能性があります。

そのため、異なるOSでデータ変換をおこなう場合は注意が必要です。


ダブルクォート

CSVファイルで区切ったデータの中に、カンマ(,)、改行(、)、ダブルクォート(")といった「制御文字」を含む場合は、対象のデータをダブルクォート(")で囲む必要があります。

ダブルクオートで囲う



どのような場合にCSVを使うのか?

CSVファイルは主に以下のような場合に利用します。

  •  基幹システムへのアップロードやダウンロード
  • データベースへのインポートやエクスポート
  •  MAツールやBIツールなどアプリとのデータ連携
  •  ファイルのデータ容量を軽くする
  •  統計情報などのビックデータ分析用データセットをCSVで配布

基本的に、データベースや基幹システム等においては、Excelファイルと互換性がないため、Excelで作った表はCSVファイルに変換して読み込む必要があります。

また、データベースや基幹システム側でもExcelとして出力できないため、CSVファイルとして出力し、Excelに読み込ませ表示させています。

CSVがこのように様々な場面で利用されている理由の1つには、装飾や機能が省かれることによってデータ容量が軽くなるという特徴があります。

データをたくさん入れても容量が大きくなりにくいため、データの作成やダウンロードに時間がかからないCSVは重宝されており、多様な場面で活用されています。


どのような場合にExcelを使うのか?

Excelファイルは主に以下のような場合に利用します。

  • 表計算といったデータの集計や分析
  • 作成したレポートをそのまま活用したい場合
  • 印刷設定が重要な場合

基本的に、Excelファイルを用いる時は、Excelデータと互換性のあるソフトだけでデータの編集・閲覧が完結する場合です。その場合は集計や分析がおこなえるExcelデータをそのまま使った方が便利です。



CSV利用時の注意点

CSVファイルをExcelで開く際に元のデータが変わってしまう場合があります。

これは、Excelが勝手に日付のような見た目のデータを日付として扱ってしまうことがあるためです。

主に以下のような問題がよく挙げられます。


番地や数列が日付に変換されてしまう

こちらはアンケートフォームや顧客データなどでよく発生する現象です。

「2021-7-7」といった数列や番地の「1-7-7」といった記述が「2021/7/7」というように日付に変更されてしまいます。


「年/月」が「英語の月-年の下2桁」の書式に変更されてしまう

こちらも日付に関連した現象です。

「2021/5」といった年月の記述があった場合、「Jun-21」のように変換されてしまいます。


数列の頭の「0」が消えてしまう

例えば「0312345678」といった電話番号など、数列の頭が「0」であるデータはCSVからExcelにファイルをインポートすることで消されてしまう場合があります。

一般に「0落ち」などと呼ばれます。


カッコつきの数がマイナスの数に変換されてしまう

「(1)」など、カッコつきの文字が「-1」に変換されてしまいます。

これは、欧米の財務諸表では、マイナスの数値を括弧で囲むというルールがあることが要因になっています。



CSVでデータが変わってしまった時の対処方法

では、これらの問題はどのように対処したら良いのでしょうか。
対処法をご紹介します。(※Windowsの場合)

【1】CSVファイルをメモやテキストエディタで開きます。

CSVのデータが書き換わってしまった際の対処1


【2】内容を全てコピーします。

CSVのデータが書き換わってしまった際の対処2


【3】 Excelを起動し、空白のブック(新規ファイル)に貼り付けをおこないます。

CSVのデータが書き換わってしまった際の対処3


【4】1列目を選択した状態で、「データ」メニューの「区切り位置」をクリックします。

CSVのデータが書き換わってしまった際の対処4


【5】「カンマやタブなどの区切り文字によってフィールドごとに区切られたデータ」を選択し、「次へ」をクリックします。

CSVのデータが書き換わってしまった際の対処5


【6】区切り文字にて「コンマ」を選び、「次へ」をクリックします。

CSVのデータが書き換わってしまった際の対処6


【7】列ごとに「列のデータ形式」 を指定することができます。

必要に応じで 「データのプレビュー」で列を選択しながら、形式を指定します。

ここで、住所や電話番号など変換されたくない項目で「文字列」を選ぶことによってデータの変換を防ぐことが可能です。

CSVのデータが書き換わってしまった際の対処7

「完了」をクリックすると、データが変換されずにCSVが正しく表示されます。


アララではどのように使われているのか

では実際に、アララでは「CSVファイル」をどのように使用しているのかお伝えします。

現在アララでは、主に2通りの使い方をしています。

  1. CSVファイルを用いて、配信リストやユーザ属性をシステム側に簡単登録できる
    (自動で行うことも可能です)
  2. メールの効果測定結果をCSVで出力できる

①CSVファイルを用いて、配信リストやユーザ属性をシステム側に簡単登録できる

こちらはメール配信サービス「アララ メッセージ」の機能の1つです。

方法としては、アララ メッセージからのCSVテンプレートをダウンロードし、そこに顧客情報を入力後、アララ メッセージにインポートします。

これで登録完了です。


➁メールの効果測定結果をCSVで出力できる

こちらもアララのメール配信サービス「アララ メッセージ」の機能の1つで、「配信したメールは、どのぐらい開封されているのか」「メールに記載しているURLがどのぐらいクリックされているのか」などを見ることが可能です。


​​​​​​​


まとめ

今回のコラムで、「CSV」の特徴や使われ方、注意点などご理解いただけましたでしょうか。

次回も、みなさまにお役立ていただけるようなコラムを配信してまいります。


また、メール配信に関してお悩みなどございましたらお気軽にお問い合わせください。



著者
アララ メッセージ マーケティングチーム

メール配信運用、メールマーケティングに関する情報をお届けするコラムです。“知ってるとちょっとイイコトがある”情報を発信します。




関連コラム

  IPアドレスとは? IPアドレスとはネットワーク上にある機器を識別するための数値です。通信相手を間違わないために用いられており、ネットワーク上の住所や電話番号のような役割をしています。 アララ メッセージ
  API連携とは何か?メリット・デメリットや実際の事例をご紹介 API(Application Programming Interface)とは、ソフトウェアの機能を共有することを意味します。APIを連携することで【簡単に幅広いサービスが提供できる】【開発の効率化とコスト削減】【セキュリティと顧客満足度の向上】といったメリットがあります。 アララ メッセージ


  httpとhttpsの違いとは?今更聞けない「s」の意味 httpとhttpsには「安全性」という大きな違いがあることを知っていますか?それぞれの解説と併せて、通信相手を確認するSSLサーバ証明書の確認方法をお伝えします。 アララ メッセージ
  ドメインとは?構成要素からメール配信との関連性まで一挙ご紹介 メール配信において重要になってくる「ドメイン」。このドメインはどのような役割を果たしているかご存知でしょうか?今回はIT初心者向けに「ドメインとは?」について紹介していきます。 アララ メッセージ


メール配信サービスのお役立ち資料一覧

アララ メッセージ製品情報

アララ メッセージ導入事例集

成果に差が出る!「メルマガにおける目的設定」ガイド

安定配信を実現する!「メール配信API」選定のコツ

メール配信サービスのお役立ち資料一覧

CONTACT
お電話でのお問い合わせはこちら
平日10:00~18:00
ご不明な点はお気軽に
お問い合わせください
メール配信システムの
お役立ち資料はこちら

気記事ランキング


関連記事


サービス詳細