Embulkとは
fluentdのバッチ版のようなツールで、データを一括転送したい時に利用します。
ref: GitHub - embulk/embulk: Embulk: Pluggable Bulk Data Loader.
メリット
自前で実装すると面倒な
- 並列実行でパフォーマンスの最適化
- validation
- dry-run
- エラーリカバリ
- 冪等なリトライ
といった部分をサポートしてくれている上、
- fluentdと同様にプラガブルに作られているので、inputもoutputも開発者が自由に開発できる
ため、プラグインが豊富なので大抵のユースケースをカバーできます。
なので自前でデータ転送をスクリプトやら簡易コードで書いたりすることはできるけれど、後々の運用を考えるとEmbulkを導入した方がいいケースは多々あると思います。
続きを読む