コンテンツにスキップ

データファイルリファレンス

データファイルとは

データファイルは、検索に使用するデータです。

  • 商品データファイル
  • 候補語登録ファイル
  • 候補語除外ファイル
  • デフォルト表示キーワード登録ファイル
  • 表示順制御ファイル
  • 類語登録ファイル

商品データファイル

商品情報のデータファイルです。
次の形式、書式でファイルに格納してください。

  • RFC4180 に準拠した形式の CSV もしくは タブ区切りテキスト (TSV)
  • 文字コードには UTF-8 を用いる。BOM (バイトオーダーマーク) は使用しない
  • 1 行目に 1 列から 14 列までのフィールド名を持つヘッダ行を記述する
  • フィールドの順序は変えない
  • フィールドのデータにタブや改行を含む制御文字は使用しない
  • 行の区切りは LF (line feed) で区切る
  • TSV では、項目をダブルクォートで囲むことはできない

各列に格納するデータは下表のとおりです。

フィールド名 項目 必須 表示 候補語 検索
1 (A) id 商品 ID
2 (B) link 商品ページ URL
3 (C) title 商品名
4 (D) summary 商品説明
5 (E) image 商品画像 URL
6 (F) any1 ユーザー定義データ1
7 (G) any2 ユーザー定義データ2
8 (H) any3 ユーザー定義データ3
9 (I) sort1 ソート用データ1
10 (J) sort2 ソート用データ2
11 (K) sort3 ソート用データ3
12 (L) keywords キーワード
13 (M) itemcode 商品コード
14 (N) searchtext 検索用追加テキスト

必須:必ず指定すべき項目

表示:商品検索結果での表示に使用される項目

候補語:候補語の抽出の対象となる項目

検索:検索の対象となる項目

商品 ID (id)

商品を一意に識別できる文字列を格納します。

商品ページ URL (link)

商品検索結果をクリックした際に遷移するページのURLを格納します。
スキーム (https: や http:) を含まない、// (連続するスラッシュ 2 つ) から始まる文字列を格納してください。

商品名 (title)

商品検索結果に表示される商品名を格納します。この商品名は、候補語の抽出や、商品検索でも用いられます。

商品説明 (summary)

商品検索結果に表示される商品の説明文を格納します。この商品説明は、候補語の抽出や、商品検索でも用いられます。

商品画像 URL (image)

商品検索結果に表示される画像の URL を格納します。
スキーム (https: や http:)を含まない、// (連続するスラッシュ 2 つ) から始まる文字列を格納してください。
表示速度や画質の観点から、90 ピクセル × 90 ピクセルの大きさの画像を推奨します。
(それより大きめの画像を選ぶ場合でも、できるだけこの大きさに近いものを推奨します。)

ユーザー定義データ1 ~ 3 (any1 ~ any3)

ユーザー定義データ1 ~ 3は、特に用途が決められていません。
たとえば、価格やお薦め度など、データ作成者が用途を決めます。
このデータは商品検索結果に表示することができます。

ソート用データ1 ~ 3 (sort1 ~ sort3)

商品検索結果のソートに使用するデータを指定します。
数値の場合は桁数を揃えてください。
桁が足りないデータは左側を 0 で埋めて、全商品で桁数を揃えてください。
桁数がそろっていない数値データは正しくソートできません。

ソート用データ1 ~ 3のいずれをソートに使うか、また優先度、さらにソートの方向を、弊社へのお申し込み時にお知らせください。

キーワード (keywords)

この商品に関する特徴的なキーワードを記入します。ここに記入したキーワードは、候補語として登録されます。
また、商品検索用の単語としても登録されるため、このキーワードを入力すると、この商品が商品検索結果の候補になります。

キーワードが複数ある場合にはカンマで区切ります。
(カンマの前後にスペース不要。カンマを含む候補語の登録不可)

他の商品に同じキーワードが存在しても問題ありません。

商品コード (itemcode)

商品レコメンド機能で、レコメンドサービスと連携させる場合に使用します。
レコメンドサービス側で認識される商品識別コードを格納します。
レコメンドサービスとの連携につきましては、弊社営業までお問い合わせください。

検索用追加テキスト (searchtext)

商品検索でヒットさせたい文字列を記入します。
キーワードのカラムや商品説明のデータとは異なり、検索用追加テキストは、候補語や表示の対象にはなりません。

候補語登録ファイル

独自の候補語や読み仮名を登録するのに使用します。
また、候補語を上位に表示するのにも使用します。
次の形式、書式でファイルに格納してください。

  • RFC4180 に準拠した形式の CSV
  • 文字コードには UTF-8 を用いる。BOM (バイトオーダーマーク) は使用しない
  • 1 行目に各列の定義を示すフィールド名を持つヘッダ行を記述する
  • フィールドのデータにタブや改行を含む制御文字は使用しない
  • 行の区切りは LF (line feed) で区切る

候補語登録ファイルのカラム構成は次のとおりです。

フィールド名 項目 必須
keyword 候補語 (表示される文字列)
yomi 読み (ひらがな)
weight 優先度 (1 から 100 の数値。大きいほうが優先的に表示される)
remarks コメント (登録内容は動作に影響しない)

優先度の指定を省略した場合には、20 が適用されます。
また、読みを省略した場合には、読みが自動的に付与されます。

複数の読みを持つ候補語を登録するには、同じ候補語を、読みを変えて複数登録します。
下記の例では、「ビール」という候補語に「びいる」、「びあ」、「beer」の 3 つの読みを割り当てています。

keyword,yomi,weight
ビール,びいる,20
ビール,びあ,20
ビール,beer,20

候補語除外ファイル

不要な候補語を削除するのに使用します。
次の形式、書式でファイルに格納してください。

  • RFC4180 に準拠した形式の CSV
  • 文字コードには UTF-8 を用いる。BOM (バイトオーダーマーク) は使用しない
  • 1 行目に各列の定義を示すフィールド名を持つヘッダ行を記述する
  • フィールドのデータにタブや改行を含む制御文字は使用しない
  • 行の区切りは LF (line feed) で区切る
フィールド名 項目 必須
keyword 除外する単語
remarks コメント (登録内容は動作に影響しない)

デフォルト表示キーワード登録ファイル

検索ボックスに文字を入力する前に、キーワードを表示するのに使用します。
次の形式、書式でファイルに格納してください。

  • RFC4180 に準拠した形式の CSV
  • 文字コードには UTF-8 を用いる。BOM (バイトオーダーマーク) は使用しない
  • 1 行目に各列の定義を示すフィールド名を持つヘッダ行を記述する
  • フィールドのデータにタブや改行を含む制御文字は使用しない
  • 行の区切りは LF (line feed) で区切る
フィールド名 項目 必須
keyword 表示するキーワード
rank 表示する順位

類語登録ファイル

キーワードの言い換えや表記の揺れを解決するのに使用します。
次の形式、書式でファイルに格納してください。

  • RFC4180 に準拠した形式の CSV
  • 文字コードには UTF-8 を用いる。BOM (バイトオーダーマーク) は使用しない
  • 1 行目に各列の定義を示すフィールド名を持つヘッダ行を記述する
  • フィールドのデータにタブや改行を含む制御文字は使用しない
  • 行の区切りは LF (line feed) で区切る
フィールド名 項目 必須
keyword 見出し語
synonym1 類語1
synonym2 類語2
synonym3 類語3
synonym4 類語4
synonym5 類語5

表示順制御ファイル

検索結果の表示順を変更するのに使用します。
次の形式、書式でファイルに格納してください。

  • RFC4180 に準拠した形式の CSV
  • 文字コードには UTF-8 を用いる。BOM (バイトオーダーマーク) は使用しない
  • 1 行目に各列の定義を示すフィールド名を持つヘッダ行を記述する
  • フィールドのデータにタブや改行を含む制御文字は使用しない
  • 行の区切りは LF (line feed) で区切る
フィールド名 項目 必須
keyword 見出し語
url URL
score スコア
remarks コメント (登録内容は動作に影響しない)

カスタムサジェストデータファイル

カスタムサジェストを表示するのに使用します。

前提

カスタムサジェストオプション の契約が必要です。

次の形式、書式でファイルに格納してください。

  • RFC4180 に準拠した形式の CSV
  • 文字コードには UTF-8 を用いる。BOM (バイトオーダーマーク) は使用しない
  • 1 行目に各列の定義を示すフィールド名を持つヘッダ行を記述する
  • フィールドのデータにタブや改行を含む制御文字は使用しない
  • 行の区切りは LF (line feed) で区切る
フィールド名 項目 必須
name 表示する名称
icon_url アイコンの URL
link 遷移先 URL
weight レコードの重み。整数値で指定。大きいものが優先的にヒットする
keywords ヒットさせるキーワード。複数指定する場合はカンマ区切りで指定する

文字に関する制限

設定データファイルに含めることができる文字には制限があります。
以下は不正な文字として扱います。
インデクシングで不正な文字があった場合、エラーとなり、データベースは更新されません。

  • バイトオーダーマーク (BOM)
  • 制御文字
  • UTF-8 として正しくないバイト列

制御文字には、VT (Vertical Tab–0B)、CR (Carriage Return–0D) が含まれます。
また、HT (Horizontal Tab–09) はカラムの区切り、LF (Line Feed–0A) は行末文字として扱われるため、データに含めることはできません。