6月 242014
 

asinCrawlerツールでは、MWSを使わない方式でASINコードの収集を行います。

メリットとしては、MWSを使うために、毎月の費用が要らないです。しかし、問題は、アマゾンのページでは、1回表示できる商品の数の制限があります。

例えば、アマゾンで「GPS」というキーワードを検索する場合、「検索結果 30,411件中 1-24件 “GPS”」が表示しますが、実際のページを見ると、最大20ページしか表示できないです。結局、収集できるASINのかずは

24件/ページ*20ページ=480件しかできないです。

ここでは、asinCrawlerツールはこの問題を対応するために、「自動絞込み」方式を採用しております。

自動絞込みの意味は、例えば、先のキーワードで30441件のデータなのに、表示できる数は少ない場合、ソフトウェアは自動的にまず、価格を検索の条件で総かずを絞り込んで検索をかけます。アマゾンは価格を検索の条件にするために、特定のカテゴリを選択する必要があります。今回のGPSで例では、アウトドアのGPSを検索したいであれば、「スポーツ&アウトドアストア」というカテゴリを選択します。

実際データ収集の場合、の画像はつぎです。

dfffdfff

ソフトウェアは、全部のASINは50ページを超えていることを検知する場合、自動的に、価格で絞り込んでう、0円~50000円の商品を収集します。ページ数はまた50ページを超える場合、0円~25000円を収集します。以上の流れです、ソフトウェアは下記の順番でASINを収集していることがわかります:

  1. 0~12500円
  2. 12500円~25000円
  3. 25000円以上

以上の方法により、一気に10万件のASINコードの収集は可能となります。

まとめ:一番重要なのが、アマゾンで検索する場合、カテゴリを指定することです。