[システムディペンダビリティ研究室]
[Japanese | English]

主な研究トピック 
確率モデルを用いてシステムの不確実な振る舞いを捉え、システムの信頼性や可用性を定量的に分析し、コスト最適なシステム設計を目指します。
新たなディペンダビリティ指標の設計や効率的な評価手法の確立などにも取り組んでいます。


フォッグコンピューティングシステムの性能信頼性解析

計算処理やデータをデータセンターに集約する従来のクラウドコンピューティングに対し、IoTセンサーやスマートフォンなどデータの発生源に近い計算端末で分散して処理を行うフォッグコンピューティングの活用が徐々に浸透し始めています。フォッグコンピューティングは環境に応じてその構成や振る舞いを柔軟に変更できる点に特長がありますが、それゆえにシステムの性能や可用性などの品質保証が難しくなる場合があります。例えば、ドローンで撮影した画像をドローン上で解析する場合と、近隣の計算ノードにオフロードして解析する場合では、その処理性能やシステムの可用性に差が生じます。望ましい処理形態は外部の環境にも依存しますので、外部環境の不確実性とそれに伴うシステムの構成変更を同時に考慮したシステム品質評価技術が求められます。本研究では確率報酬ネットを用いたモデル化手法により、フォッグコンピューティングを利用したシステムの性能や可用性の定量的分析、および設計最適化を目指しています。

関連文献
・F. Machida, Q. Zhang and E. Andrade, Performability analysis of adaptive drone computation offloading with fog computing. (FGCS2022) [link]
・Q. Zhang, F. Machida and E. Andrade, Performance bottleneck analysis of drone computation offloading to a shared fog node. (WoSoCer2022) [paper]
・F. Machida and E. Andrade, PA-offload: Performability-aware adaptive fog offloading for drone image processing. (ICFEC2021) [paper]
・F. Machida and E. Andrade, Availability modeling for drone image processing systems with adaptive offloading. (PRDC2021) [paper]

Nバージョン機械学習システムの信頼性評価

近年の機械学習やAI技術の進展により、これらの技術を取り込んだシステムの応用が広がっています。例えば自動運転車はカメラで捉えた映像から交通標識や障害物、対向車や歩行者などを高い精度で認識するために機械学習を使っています。しかし、わずかな確率でも認識を誤ると大きな交通事故を招くリスクがあるため、機械学習機能が誤った出力を出す場合も想定してシステムの信頼性や安全性を設計することが必要になります。本研究ではソフトウェア信頼性工学で研究されてきたNバージョンプログラミングの考え方を応用し、多様な機械学習モデルやデータを用いることで機械学習システムとしての信頼性を高めるアーキテクチャを検討しています。


関連文献
・F. Machida, Using Diversities to Model the Reliability of Two-version Machine Learning Systems. (TETC2023) [link][pdf]
・Q. Wen and F. Machida, Characterizing Reliability of Three-version Traffic Sign Classifier System through Diversity Metrics. (ISSRE2023) [paper]
・M. Takahashi, F. Machida, and Q. Wen, How data diversification benefits the reliability of three-version image classification systems. (PRDC2022) [paper]
・Q. Wen and F. Machida, Reliability models and analysis for triple-model with triple-input machine learning systems. (DSC2022) [paper]
・F. Machida, On the diversity of machine learning models for system reliability. (PRDC2019) [paper][slide]
・F. Machida, N-version machine learning models for safety critical systems. (DSML2019) [paper][slide]

ソフトウェアエージングの解析と予防保守(ソフトウェア若化)

IoTシステムなど実世界で長時間稼働するソフトウェアが増え、ソフトウェアを安定して稼働させ続けるための技術が重要になっています。長時間連続稼働するソフトウェアシステムでは性能や信頼性が時間経過と共に劣化する現象(ソフトウェアエージング)が見られることがあります。ソフトウェアエージングはソフトウェアのバグに起因して発生しますが、多数のソフトウェアが相互依存して動作するシステムではその根本原因を特定することは容易ではありません。そこで、システムの稼働状態をモニタリングし、集めたデータを統計的に解析することで、エージングの傾向や障害の予測、根本原因の調査を行います。エージングの傾向や障害を予測することで、適切なシステムの予防保守計画を立てることが可能になります。ソフトウェアを再起動してエージング状態をクリアするソフトウェア若化や、システムへリソースを動的に追加することで寿命を先延ばしするソフトウェア延命などの予防手法があります。その有効性を評価する際に確率モデルが役に立ちます。

関連文献
・E. Andrade, R. Pietrantuono, F. Machida, and D. Cotroneo, A comparative analysis of software aging in image classifiers on cloud and edge. (IEEE TDSC 2023) [link]
・D. Dias, F. Machida, and E. Andrade, Analysis of software aging in a blockchain platform. (WoSAR2022) [paper]
・K. Watanabe and F. Machida, Availability analysis of a drone system with proactive offloading for software life-extension. (COINS2022) [paper]
・F. Machida et al., Lifetime extension of software execution subject to aging. (IEEE TR 2017) [link][paper]

Last update: 2024.1.19