研究紹介

ベイズ的深層学習を用いた画像テキスト検索における信頼性評価

深層ニューラルネットワークを含む,多くの機械学習アルゴリズムで出力結果の信頼性をいかにして評価するかは大きな課題である.分類問題,回帰問題においては, ベイジアンニューラルネットワークの出力の不確実性によって信頼性を評価する方法が提案されている.しかし, 画像テキスト検索は分類や回帰とは異なるタスクであり, 信頼性の評価方法を検討する必要がある.本研究では画像テキスト検索を分類問題としての解釈(事後分布の不確実性),回帰問題としての解釈(埋め込み点の不確実性)により二つの不確実性を定義した.その結果, 二つの不確実性でモデル平均による検索精度の向上が見られた. また,事後分布の分散が大きいデータをクエリーから除くことで,大幅な精度改善が見られたことから,分類問題としての不確実性が信頼性の評価に適していることを示した.

本研究は総務省SCOPEの委託,科学研究費補助金の助成を受けて実施された.

  • Kenta Hama, Takashi Matsubara, Kuniaki Uehara, and Jianfei Cai, “Exploring Uncertainty Measures for Image-Caption Embedding-and-Retrieval Task,” ACM Transactions on Multimedia Computing, Communications, and Applications, vol. 17, no. 2, article no. 46, 2021. (arXiv)
  • Kenta Hama, Takashi Matsubara, and Kuniaki Uehara, “Image-Caption Retrieval with Evaluating Uncertainties,” Proc. of The 7th Japan-Korea Joint Workshop on Complex Communication Sciences (JKCCS), Pyengonchang, Jan. 2019.

0000.png

0001.png

0002.png

0003.png

0004.png