日本皮膚科学会 (東北大学・筑波大学・大阪大学)、東京農工大学清水研究室、NII RCMBの共同研究による、多彩な皮膚症状を呈する皮膚疾患の分類に関する論文がInternational Journal of Computer Assisted Radiology and Surgeryに受理されました。

皮膚疾患の種類はとても多く、また、その臨床症状は多岐にわたります。そのなかには、外観は類似していても悪性度が異なったり、病状が急速に増悪して予後不良だったりする疾患があります。このような皮膚症状を皮膚科が専門ではない医師が的確に鑑別することは難しいのが現状です。そのため、一般医が利用することを想定した診療補助AIの研究開発が望まれています。

今回の研究では皮膚症状の画像から59種類の皮膚疾患をいっぺんに鑑別することを目標としました。この59種類の皮膚疾患には限局性のみならず、瀰漫 (びまん) 性に症状を呈するものも含まれています。さらに、撮影条件が統一されていない画像、例えば撮影機材や照明、倍率などが異なるさまざまな画像を扱えることも目標としました。

Masaya Tanaka, Atsushi Saito, Kosuke Shido, Yasuhiro Fujisawa, Kenshi Yamasaki, Manabu Fujimoto, Kohei Murao, Youichirou Ninomiya, Shin’ichi Satoh and Akinobu Shimizu

Classification of large‐scale image database of various skin diseases using deep learning

International Journal of Computer Assisted Radiology and Surgery, 16, 1875-1887 (2021)

Abstract

Purpose The purpose of this study was to develop a deep learning-based computer-aided diagnosis system for skin disease classification using photographic images of patients. The targets are 59 skin diseases, including localized and diffuse diseases captured by photographic cameras, resulting in highly diverse images in terms of the appearance of the diseases or photographic conditions.
Methods ResNet-18 is used as a baseline model for classification and is reinforced by metric learning to boost generalization in classification by avoiding the overfitting of the training data and increasing the reliability of CADx for dermatologists. Patient-wise classification is performed by aggregating the inference vectors of all the input patient images.
Results The experiment using 70,196 images of 13,038 patients demonstrated that classification accuracy was significantly improved by both metric learning and aggregation, resulting in patient accuracies of 0.579 for Top-1, 0.793 for Top-3, and 0.863 for Top-5. The McNemar test showed that the improvements achieved by the proposed method were statistically significant.
Conclusion This study presents a deep learning-based classification of 59 skin diseases using multiple photographic images of a patient. The experimental results demonstrated that the proposed classification reinforced by metric learning and aggregation of multiple input images was effective in the classification of patients with diverse skin diseases and imaging conditions.

Keywords Computer-aided diagnosis · Localized skin disease · Diffuse skin disease · Photographic image

DOI: 10.1007/s11548-021-02440-y

ResNet-18をモデルの原法とし、距離学習 (metric learning) とアグリゲーション (aggregation) による改変を加えて提案手法としました。距離学習は、サンプルの特徴量を抽出し、特徴量を比較して類似したサンプルを特徴空間内の近くに埋め込み、似ていないサンプルを遠くに埋め込むような変換を学習するモデルです。分かり難いですね。比較対象が皮膚表面の画像であれば、同じ疾患の画像は類似性の高さに基づいて近距離に配置し、異なる疾患の画像は類似性の低さに応じて遠くに配置する空間を探し出す学習といえます。クラス間の分離、つまり疾患分類の精度向上を期待できます。

アグリゲーションは症例単位で疾患分類を行うための工夫です。皮膚科では一人の患者について複数の写真を撮影することが多くあります。多くの医療画像AIは画像1枚ごとに画像認識していますが、これを患者ごとに疾患の判定を行えるよう、同じ症例の複数の写真をまとめて扱って判定できるようにしました。ただ、1症例あたりの撮影枚数は定まっておらず、入力画像の枚数が症例ごとに異なっても対応できるような仕組みを作りました。

もう一つの大きな工夫は、59種類の皮膚疾患をそれぞれの症状の類似性や病理学的特徴に応じて大分類・中分類・小分類の三つのレベルの分類樹 (Taxonomy-tree) へ階層的に分類したことです。大分類 (Level1) は悪性腫瘍や良性腫瘍、炎症性疾患、自己免疫性疾患などの8クラス、中分類は (Level2) は上皮性やメラノサイト性などの13クラス、小分類 (Level3) は59種類の各疾患 (59クラス) がそれぞれ属します。この分類樹によって、モデルによる分類結果の妥当性をそれぞれの階層レベルで評価することができました。

本研究では、日本皮膚科学会が構築、運営している皮膚疾患画像データベース (National Skin Disease Database, NSDD) より、匿名化した13,038症例の計70,196画像を利用しました。提案手法は既存手法との比較で顕著な成績向上を認めました。一方、悪性黒色腫と色素性母斑との鑑別など、分類精度に課題の残る結果もありました。今後は学習データを増やし、より高い分類精度を目指す予定です。