こんにちは。てぃろです。
今回はただのコマンドメモです。
対象のAWS CLIのバージョン
aws-cli/2.2.38 Python/3.8.8 Darwin/20.6.0 exe/x86_64 prompt/off
AWS CLIでデータをダウンロードしたいモチベーション
会社の研修課題でここに紹介されているデータセットをダウンロードしたいというのがモチベーションです。
https://registry.opendata.aws/amazon-reviews-ml/
こちらは、Amazonの商品レビューのデータセットでレビュー商品の商品カテゴリとレーティング(星)、レビュータイトルとレビュー本文が入ったデータです。
ファイル形式はjsonですが、結構な容量なものです。
まず、これが存在することを確認します。
AWS CLIでS3にあるデータを参照する
上記のデータ紹介ページにアクセスすると、その右側にこのようなコマンドがあるので打ってみます。公開されているものなので、アクセス権限は気にしなくても良いみたいです。
S3にデータがあるか確認するコマンドは書き直すとコチラです。
aws s3 ls s3://amazon-reviews-ml/ --no-sign-request
今回は認証不要なので、うしろにオプションがついている。
次に、これをダウンロードします。
AWS CLIでS3にあるデータをダウンロードする
コマンドはこちらです。
aws s3 cp s3://amazon-reviews-ml/ ./ --recursive --no-sign-request
これでディレクトリごとダウンロードすることができる。
今回は以上です。