概要
オンプレからクラウドに移行(マイグレーション)した場合や、クラウド上でセルフホスティングしていたDBをマネージドDBに移行した場合に問題となるのが「データは欠損なく移行されたか」です。
データの数が少なければプログラミングで差分チェックなどを書けますが、億単位の数であったりTB単位のサイズといったオーダーでは自前でプログラミングして差分を出すのは現実的では有りません。
そこで分散処理に強いBigQueryを利用することで、大規模データのマイグレーションにおいても完全性のチェックが実現できます。
環境
- mongoexport 100.5.0
- gsutil 5.5
- bq v2.0.72
アーキテクチャ図
アーキテクチャとしては以下です。今回データベースはMongoDBを想定しています。
続きを読む