Publications internationales
Résumé: Capsule network (CapsNet) is a novel architecture that takes into account the hierarchical pose relationships between object parts, which had achieved desirable results on image classification. EM-Routing (EM-R) used in CapsNet is the process of assigning child capsules (parts) to each parent capsule (objects) based on a level of agreement, which is similar to the fuzzy clustering process. However, CapsNet still struggles with backgrounds and the presence of noise. In this paper, a new routing algorithm based on a weighted capsule fuzzy gaussian model (WCFGM-R) and a pose loss function are proposed. The proposed algorithm aims to prohibit atypical child capsules from contaminating the parent capsules by incorporating the activations of capsules in a lower layer as weights that play the role of precision. The pose loss provides the best inter-class separation and improves the ability of pattern classification. Indeed, the experimental analyses demonstrate that CapsNet with WCFGM-R outperforms the CapsNet with EM-R in which it shows excellent results on three datasets (MNIST-bg-img, MNIST-bg-rnd, and CIFAR10).
Communications nationales
Résumé: Au cours des dernières décennies, le monde a connu une véritable explosion du volume de données. Une façon de traiter cette grande quantité d'informations est de la catégoriser ou de la regrouper en groupes de catégories significatives et utiles, ce qui conduit à l'émergence et à la croissance de nombreuses techniques de regroupement. Le problème de clustering est une méthode d'apprentissage non supervisée, qui peut détecter la structure dans les points de données, tandis que le clustering flou est un outil important pour découvrir la structure des données car il capture la structure d'imprécision existante dans les données réelles. Par rapport au schéma dur, le clustering flou fournit plus d'informations sur la structure des données à l'utilisateur. Le clustering Fuzzy c-means (FCM) est une méthode répandue et largement utilisée. Elle est considérée comme une méthode de regroupement floue basée sur la fonction objectif. À l'heure actuelle, la méthode de regroupement FCM est largement appliquée à la reconnaissance de formes, à la vision par ordinateur, à la segmentation d'images et à d'autres domaines étroitement intégrés à la vie réelle. Le problème de classification d'images est une tâche d'apprentissage supervisé qui tente de donner un sens à l'image entière dans son ensemble. Son objectif est d'affecter chaque image à sa classe précise en extrayant un modèle qui peut décrire la classe de l'image à partir de l'ensemble de données. Il est très important d'extraire une représentation appropriée de l'image d'entrée. L'apprentissage en profondeur (deep learning (DL)) est devenu un domaine de recherche efficace et a atteint une classification sophistiquée des images. Il imite le mécanisme d'apprentissage biologique du cerveau humain en construisant un modèle de structure profonde avec plusieurs couches cachées qui apprend automatiquement des représentations simples aux représentations complexes. Bien que les modèles DL obtiennent de bons résultats, la construction de modèles capables d'extraire des représentations de niveau supérieur de l'image et de construire un meilleur classifieur reste un problème de recherche majeur en apprentissage profond.