www.slideshare.net
- テストケースがfailするのは大体の原因は使用変数の数がレジスタ数を超えてしまい、レジスタ割付けに失敗するから
このアーキテクチャにおいてはレジスタスピルは現実的な時間で行うことは不可能で、レジスタ割付け自体の改善がもとめられるが これはさらなる解析が必要で一朝一夕には解決しない - 性能が低い理由はかなりいっぱいあるが
- 2命令同時実行のための命令スケジューラがない
- メモリのread, writeをfusionしないといけないが、これが全然動いていない
- Kernel fusionが動いていない
- メモリを気をつけないとすぐ不効率になる
例えばDMA転送とTMUでのロードで、キャッシュ不整合が起きるために保守的にTMUロードで十分なところをVPMでロードする - (当然基本的な最適化不足)