越境 M4 で WhisperKit/Core ML のバッチ書き起こしを行うと、並行・バッチ長・精度がユニファイドメモリとNVMe を同時に使います。意思決定表、sysctl/モニタ参考閾値、Wq/Wc、五段階手順です。関連:mlmodelc 稿、ORT CoreML 稿、リージョン費用。料金・購入・ヘルプはログイン不要です。
運用上のつまずき
- 並行過多。重みとキャッシュがユニファイドメモリで重なり尾遅延が先に悪化します。
- バッチと精度。長チャンクはピークが大きく 16GB で先に限界。量子化は実測し固定加速比は主張しません。
- 単一タイマー。待ちと計算を束ねると再試行がキャッシュを揺らし切り分けが曖昧になります。
意思決定マトリクス(定性)
行はガードレールです。モデルと音声コーデックに合わせ、短いベンチで再測定してください。
| 形 | 並行 | バッチ長・精度 | 16GB/24GB | ディスク IO | Wq/Wc |
|---|---|---|---|---|---|
| 常時 API | 1 から、信号量で上限 | 短チャンク・量子化 | 16GB 狭い | 並列読み抑制 | Wq 短/Wc に窓 |
| 夜間バッチ | 16G 1〜2/24G 2〜3 計測 | 文境界・p95 二分 | 24G 双路有利 | 内蔵 NVMe | Wq 長め/Wc p95+ |
| 共有 | テナント上限 | 精度揃え並行抑止 | 大容量で争い減 | スクラッチ分離 | 二段を指標化・降格先 |
性能は保証しません。ビルド差で変動します。リージョン替えは再プロファイル。
sysctl とアクティビティモニタの参考閾値
読み取り専用の出発点です。
sysctl hw.memsize
sysctl hw.ncpu
sysctl vm.swapusage
- vm.swapusage 増→並行・バッチ↓。
- メモリ圧力 黄赤→セッション追加停止。
- CPU 長時間 ~85% 超→並行見直し。
- ディスク 飽和→Wq 短く・ワーカー↓。
ランブック(五段階)
- ウォーム後にバッチ長を二分し p50/p95 とピークを記録します。
- 信号量で並行上限をかけ、キュー長と待ち時間を可視化します。
- Wq はディスクと上流、Wc は WhisperKit 経路に分けます。
- 16GB は量子化と短チャンクで出発し、24GB のみ段階的に並行を伸ばします。
- リージョンを変えたら遅延だけでなくNVMe のステージング経路も再確認します。
引用可能な三行
- ユニファイドメモリはノード全体の出来事。
- 待ちと計算は別ラベル。
- SSD 律速ならコア増だけでは足りない。
料金・ノード・ヘルプ
まとめと転換
並行・バッチ・Wq/Wc を表で束ね、タイムアウト延長より降格を先に。2026-rent-remote-mac-m4-whisperkit-batch-matrix.html