研究紹介
ランダムな画像切り抜きと貼り付けを用いたデータ拡張
膨大なパラメータを持つ深層畳み込みニューラルネットワーク(Convolutional Neural NetWork; CNN)は,画像処理の分野において大きな成果をあげている. しかし,学習データに対して膨大すぎるパラメータを持つ深層CNNは,常に過学習を起こすリスクを負う. この問題を解決するために,学習データの擬似的な水増しを行う,data augmentationの手法がいくつか提案されてきた. 画像反転,くり抜き,拡大縮小や色彩情報の変換などのdata augmentationは,学習データに対する過学習を抑制し,深層CNNのより高い性能の実現に貢献してきた. 本研究では,このようなdata augmentationの手法をさらに発展させ,4枚の異なる画像をそれぞれランダムにくり抜き,それらを貼り合わせて新たな学習画像を構成する新たなdata augmentationの手法を提案し,画像処理の更なる高精度化を実現する.
本研究は総務省 戦略的情報通信研究開発推進事業(SCOPE)の委託を受けて行われた.
Githubにてソースコードを公開しています.
Qiitaにて紹介や検証の記事を書いていただいています.
関連文献
- Ryo Takahashi, Takashi Matsubara, and Kuniaki Uehara, “Data Augmentation using Random Image Cropping and Patching for Deep CNNs,” IEEE Transactions on Circuits and Systems for Video Technology, vol. 30, no. 9, pp. 2917-2931, 2020. (link) (arXiv)
- Ryo Takahashi, Takashi Matsubara, and Kuniaki Uehara, “RICAP: Random Image Cropping and Patching Data Augmentation for Deep CNNs,” Proc. of The 10th Asian Conference on Machine Learning (ACML2018), Beijing, Nov. 2018, pp. 786-798. (acceptance rate 57/230=0.248) (link)