大規模重み・データセットをリモートMacへ集めるとき、先に効くのはRTTと外向き帯域、続いてAPFSの空きと書き込みです。本稿は日韓港新と米西の代表仮定、aria2/curl並列、tmpと容量閾値、IOチェックをまとめます。料金・SSH/VNC入門・ブログ索引もご利用ください。
① 要点:ノード所在地が転送設計を決める理由
近傍オリジンなら並列が伸びやすく、米西へ太平洋跨境だと遅延支配で過剰並列が逆効果になりがちです。Mac側は空き容量とスワップが二次上限です。
② 痛点の整理(番号付き)
- 経路:米西ソースでアジアノードはRTTが大きく、並列過多で再試行が増える。
- 帯域:DC出口と想定回線で頭打ちが変わり、設定の持ち込みが外れやすい。
- ディスク:小粒はIOPS、単一大物はシーケンシャルと空きが支配する。
③ リージョン仮定の対比表(代表値)
代表レンジは説明用です。実測で置換してください。論点詳細は跨区域TCO記事参照。
| 観点 | 日本・韓国・香港・シンガポール側ノード(アジア太平洋) | 米国西部ノード |
|---|---|---|
| 太平洋対岸RTT(目安) | 約120〜190ms級(経路依存) | 近傍オリジンなら約5〜40ms級 |
| 外向き帯域(レンジ) | 数百Mbps〜数Gbps契約が多い(共有) | 近傍と同一圏なら高帯域が出やすい(契約依存) |
| aria2 第一感 | 米西ソース:-x 8〜16 -s 16〜32から試験 | 近傍:-x 4〜12 -s 8〜24から増減 |
| curl 並列(複数URL) | 高RTT:-P 4〜8目安。単一URLはaria2推奨 | 近傍:-P 6〜12上限目安で調整 |
④ aria2 と curl:並列の決め方
aria2は--min-split-size=20M〜64Mで過小分割を避け、--max-connection-per-serverはCDN許容に合わせて低く始める。curlは署名URL等に強い。複数URLはxargs -P4前後から試し、規約とレートを守る。
⑤ 一時ディレクトリとAPFS閾値
TMPDIRは空きの大きいデータ用APFSへ。目標サイズの1.2倍以上の空き、使用率85〜90%超え手前で拡張。大物は絶対50GB級の余白も下限にする。
⑥ ディスクIOチェックリスト
- 大物はシーケンシャル下限を把握、小粒は並列を下げアーカイブ化を検討。
- 再開はaria2 -c/curl -C -を標準化。
- 検証は別ステージに分けディスク逼迫を避ける。
⑦ 買いとレンタル(一文)
自前は初期と固定費が重く、レンタルは公開料金で期間・リージョンを伸縮しやすく跨境検証向き(料金で実額確認)。
⑧ 実装手順(5ステップ)
- 取得元リージョンと試験オブジェクトを決める。
- 表に沿いアジアか米西のMacを選ぶ(TCO記事)。
- TMPDIRと最終パスを分け閾値を満たす。
- 試験転送でaria2/curl並列を定着。
- ログ・再開・再試行上限と通知を本番バッチに入れる。
⑨ 引用しやすい条件(3点以上)
- 太平洋跨境RTTの説明用レンジ:120〜190ms級(実測で置換)。
- 高RTTのaria2初期値:-x 8〜16 -s 16〜32。
- 空き:1.2倍+50GB級余白、curl並列は高RTT-P 4〜8/近傍-P 6〜12目安。