インポートウィザード vs データローダ 使い道に応じて使い分けを

今回は試験範囲のデータ管理に関わるところです。
データ管理自体、出題範囲は広くないので、サクっと覚えておきましょう。

スポンサーリンク

Sales Cloudはデータローダ推し

データ管理については、認定アドミニストレーターでも出題はされていました。
ただ、認定アドミニストレーターでは、データインポートウィザードについての機能が主に問われました。

Sales Cloudはもう一つのデータ管理ツール、データローダの機能が出題されます。

主に問われることとしては、データインポートウィザードのと違いについてなので、インポートウィザードでカバーできなかったものをデータローダを使って解決するケースが多いです。

データインポートウィザードの機能のおさらい

おさらいになりますが、データインポートウィザードの機能の復習から。

簡単に特徴を箇条書きすると、

  • データ上限は50,000件
  • 対応可能なオブジェクトが限られている(※1)
  • 一部オブジェクトにしかアップデート対応していない(※2)
  • ブラウザ上から使用可能
  • 取引先と取引先責任者を1回のインポートでまとめて作成できる
  • 重複の検知ができる

※1 取引先、取引先責任者、リード、ソリューション、個人取引先、記事、カスタムオブジェクト
※2 リード、取引先責任者、取引先のみ対応、SalesforceIDをキーとする

このように長短さまざまです。

やはり、最大の特徴であり一番の利点は一番下の重複検知ですね。
一般ユーザ向けに作られているだけあって、リテラシが高くないユーザにも操作性がよい反面、機能面ではそこまで優秀ではありません。

データローダはできることが多い

上記のインポートウィザードの弱点をほぼほぼカバーしているのが、データローダ。

インストールが必要だったり、API参照名など普段目にしない論理名で処理したりとややシステマチックな使い方が要求されますが、開発者レベルはまず使うことになるツールでしょう。

データローダの特徴は以下の通りです。

  • データ量は500万まで扱える(爆上げ!)
  • ユーザなどのマスタ系のオブジェクトも含めほぼ全てのオブジェクトに対応可能
  • 添付ファイルのアップロードが可能
  • バッチスケジュール(時間指定や定時実行など)可能
  • 重複の検知はできない

赤字部分がSales Cloudで重要視されるデータローダの機能となります。

添付ファイルのアップロードはBulk APIを使用してアップロードすることになります。
手順が複雑なので、ここでは述べませんが、とりあえず「できる」ということだけ覚えておいてください。

ちなみに、添付ファイルのエクスポートはデータローダではできませんが、「データのエクスポート」機能を使用することにより添付ファイルごとエクスポートできます
データのエクスポートで添付ファイルのエクスポートが可能
データ量にもよりますが、添付ファイルごとエクスポートだととても時間がかかるので、みんなが寝静まった時間にエクスポートするようスケジュールしましょう。

データローダはバッチモードでも使用可能です。
コマンドラインなどを駆使して起動させるので、これも手順が複雑ですが、とりあえず時間指定や定期実行が「できる」ということだけ覚えておいてください
ヘルプ貼っておきます…)

唯一の欠点は、重複の検知ができないことくらいでしょう。
これは外部IDでユニーク管理してしまえばあまり気にならないでしょう。

外部IDを使用する場合

外部IDはシステムが自動で割り当てるSalesforceIDとは別に、独自のルールでキー項目を作成することができます。
(外部IDの設定方法やインポート方法はこちらを参照)

同じ外部IDを持つレコードが存在すれば更新、存在しなければ挿入になります。
外部IDは、基本ユニークかつ必須項目が基本です。

外部IDで扱えるデータ型は以下の通りです。
ここを押さえておけば大丈夫でしょう。

  • テキスト
  • 数値
  • 電子メール

ユニークが推奨されるのは、キーが重複していた場合にエラーになるから。
どちらか一方に更新されるわけではなく、エラーを吐くのでデータローダー側の動きとしても覚えておきましょう。

まとめ

  • 大量データを扱うならデータローダ
  • 重複の検知ならインポートウィザード
  • 添付ファイルのアップロードはデータローダ(エクスポートは「データのエクスポート」を使用)
  • 時間指定や定時実行ならデータローダ
  • 外部IDで扱えるデータ型はテキスト・数値・電子メールの3つ

コメント