サロゲートモデルとは
サロゲート(Surrogate)は、「代理」といった意味の英語です。
サロゲートモデルとは、一般的に複雑な物理現象やシミュレーションの代わりに用いられる近似モデルのことを指します。
近年、より複雑で高精細なシミュレーションが可能になってきた一方で、現実の設計業務において、長時間の計算を何回も繰り返すことは困難です。そのため、計算リードタイムの短縮が必須となっています。
そこで、従来のシミュレーションを近似し、結果の予測を瞬時に行うサロゲートモデルが注目されています。
例えば、CAE解析を行うための工程には、CADモデルからCAE用のモデルを作成したり、境界条件の設定をしたり、計算の後処理を行ったりと、実際の計算以外の部分にも多くの時間が掛かります。
サロゲートモデルを活用すると、この一連の工程をすべてスキップして性能を予測することが可能になり、数時間かかる工程を数秒に短縮できる場合があります。
サロゲートモデルの種類
サロゲートモデルに使われるアルゴリズムにはいくつかの種類がありますが、代表的なものを以下に挙げます。 サロゲートモデルで特に問題となる「過学習」については、次章で説明いたします。
①線形回帰/多項式回帰:
データの分布を直線または多項式で近似します。
※回帰とは、簡単に言えばデータを数式で近似(モデル化)することです。実装が簡単ですが、過学習しやすいという特徴があります。
(事例)単純な材料特性予測 等
②サポートベクター回帰:
サポートベクターマシンというパターン認識モデルを応用した回帰で、データをできるだけ多く含むチューブを作るイメージです。
(事例)製造条件予測 等
③決定木/ランダムフォレスト:
決定木は、属性によってデータを分割していくことで分類を行う手法です。この決定木をランダムに組み合わせることで、ロバスト性を向上させたものがランダムフォレストと呼ばれる手法になります。
(事例)生態系予測 等
④ニューラルネットワーク:
人間の脳の働きを模した機械学習の1つであり、データの特徴を考慮することで、複雑な関係性であってもモデル化が可能です。過学習しやすく、パラメータのチューニング難易度が高いですが、非常に複雑な問題にも対応が可能です。
(事例)気象予測、医療診断 等
⑤ガウス過程:
3D-OWL®でも採用しているガウス過程は、統計学的な数理モデルであり、不確実性(予測の信頼度)を評価できます。パラメータのチューニングが非常に難しいですが、過学習しにくく、学習データが少なくても予測精度が高いという特徴があります。
(事例)熱流体解析 等
実際のCAEや実験の解析を行っている中では、学習データを多く用意することが難しい場合があります。
そこで、学習データが少なくても比較的高い精度で予測でき、さらに予測の信頼度も提供できるガウス過程が非常に有用な場合があります。
一方で、ガウス過程のパラメータをチューニングすることは非常に難しく、学習をうまく行うことは至難の業です。
実は、3D-OWL®ではこの難解なチューニングを自動で実施するため、AIに関する知識がほとんどなくても、ガウス過程の強みを最大限に発揮できます。
過学習について
サロゲートモデルにおける問題の一つに、
過学習(オーバーフィッティングとも呼ばれます)があります。
学習データに対して特化しすぎてしまった結果、
新しいデータに対しては予測精度が悪くなってしまう現象のことです。
例えば、右図の上段を見てみると、左側のモデル(オレンジ色の線)では、
学習データ(青い点)からの誤差がほとんどありません。
しかし、図の下段のように、新しいデータ(黄色の点)に対しては、
左側のモデルの方がデータまでの誤差が大きいことが分かります。
このように、過学習となってしまうと、汎用性がなく実運用には適しません。
3D-OWL®が採用しているガウス過程は、
原理的に過学習しにくいという特徴があります。
おわりに
トヨタシステムズは、サロゲートモデルを業務へ適用できるツール『3D-OWL®』を、効果的にご利用いただけるよう全力でサポートいたします。ご質問やご相談はいつでもお待ちしておりますので、お気軽にお問い合わせください!