0% ont trouvé ce document utile (0 vote)

40 vues16 pages

Clustering

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

40 vues16 pages

Clustering

Transféré par

Naima Hassoune

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

Data 2021 :

Il semble que vous ayez déjà regroupé vos données en clusters à l'aide de l'algorithme k-means et
que vous ayez extrait certaines caractéristiques pour chaque cluster. Vous voulez maintenant
interpréter ces clusters en termes de niveaux de risque.

Pour cela, vous pouvez utiliser les caractéristiques que vous avez extraites pour chaque cluster et les
comparer pour évaluer le niveau de risque associé à chaque cluster. Par exemple, vous pourriez
considérer les caractéristiques suivantes pour évaluer le niveau de risque :

1. Solde : Un solde plus élevé peut indiquer une capacité financière plus importante, ce qui peut
réduire le risque.

2. Chiffre d'affaires (CA) : Un chiffre d'affaires plus élevé peut indiquer une entreprise plus rentable et
donc un risque plus faible.

3. Encaissements : Des encaissements plus élevés peuvent indiquer une meilleure gestion des
liquidités et donc un risque plus faible.

4. Créances non échues : Un nombre plus élevé de créances non échues peut indiquer une bonne
gestion des comptes clients et donc un risque plus faible.

5. Créances échues : Un nombre plus élevé de créances échues peut indiquer des difficultés de
paiement et donc un risque plus élevé.

6. Taux de recouvrement des créances échues : Un taux de recouvrement plus faible peut indiquer
des difficultés à récupérer les dettes et donc un risque plus élevé.

7. Délai de recouvrement en jours : Un délai de recouvrement plus long peut indiquer des problèmes
de paiement et donc un risque plus élevé.

8. Caution : Une caution plus élevée peut indiquer une garantie financière et donc un risque plus
faible.

En analysant ces caractéristiques pour chaque cluster, vous pouvez attribuer un niveau de risque à
chaque cluster en fonction de la performance relative des entreprises qui y sont regroupées.

Par exemple :

- Cluster 0 : Risque très faible (en raison de solde élevé, CA élevé, encaissements élevés, etc.)

- Cluster 1 : Risque faible (en raison de solde modéré, CA modéré, encaissements modérés, etc.)

- Cluster 2 : Risque modéré (en raison de solde plus faible, CA modéré, encaissements modérés, etc.)
- Cluster 3 : Risque élevé (en raison de solde très faible, CA élevé mais encaissements faibles,
créances échues élevées, etc.)

Cette évaluation peut être ajustée en fonction du contexte spécifique de vos données et des critères
de risque de votre entreprise.

Data 2022 :
En fonction des caractéristiques que vous avez fournies pour chaque cluster, voici une interprétation
possible en termes de niveaux de risque :

- Cluster 0 : Risque modéré

- Solde relativement élevé

- Chiffre d'affaires (CA) moyen

- Encaissements modérés

- Nombre élevé de créances non échues

- Taux de recouvrement des créances échues élevé

- Délai de recouvrement en jours moyen à élevé

- Caution modérée à élevée

- Cluster 1 : Risque faible

- Solde très faible

- Chiffre d'affaires (CA) bas

- Encaissements bas

- Aucune créance non échue

- Aucune créance échue

- Taux de recouvrement des créances échues élevé

- Délai de recouvrement en jours très faible

- Caution basse

- Cluster 2 : Risque très faible

- Solde faible

- Chiffre d'affaires (CA) bas

- Encaissements bas

- Aucune créance non échue

- Aucune créance échue

- Taux de recouvrement des créances échues élevé

- Délai de recouvrement en jours faible

- Caution modérée

- Cluster 3 : Risque élevé

- Solde élevé

- Chiffre d'affaires (CA) moyen à élevé

- Encaissements élevés

- Nombre modéré de créances non échues

- Nombre élevé de créances échues

- Taux de recouvrement des créances échues élevé

- Délai de recouvrement en jours élevé

- Caution élevée

Cette interprétation est basée sur les caractéristiques moyennes de chaque cluster et peut être
ajustée en fonction du contexte spécifique de vos données et des critères de risque de votre
entreprise.

Data 2023:
En se basant sur les caractéristiques moyennes de chaque cluster, voici une interprétation possible
en termes de niveaux de risque :

- Cluster 0 : Risque très faible

- Solde très faible

- Chiffre d'affaires (CA) très bas

- Encaissements très bas

- Aucune créance non échue

- Aucune créance échue

- Taux de recouvrement des créances échues élevé

- Délai de recouvrement en jours faible à moyen

- Caution modérée

- Cluster 1 : Risque faible

- Solde faible

- Chiffre d'affaires (CA) moyen à élevé

- Encaissements moyens à élevés

- Aucune créance non échue

- Aucune créance échue

- Taux de recouvrement des créances échues élevé

- Délai de recouvrement en jours très faible

- Caution modérée

- Cluster 3: Risque modéré à élevé

- Solde élevé

- Chiffre d'affaires (CA) moyen

- Encaissements moyens

- Nombre moyen de créances non échues

- Nombre élevé de créances échues

- Taux de recouvrement des créances échues élevé

- Délai de recouvrement en jours élevé

- Caution élevée

- Cluster 2: Risque élevé

- Solde moyen

- Chiffre d'affaires (CA) élevé

- Encaissements élevés

- Nombre élevé de créances non échues

- Aucune créance échue

- Taux de recouvrement des créances échues élevé

- Délai de recouvrement en jours moyen à élevé

- Caution moyenne

Ces interprétations sont basées sur les caractéristiques moyennes de chaque cluster et peuvent être
ajustées en fonction du contexte spécifique de vos données et des critères de risque de votre
entreprise.

Code : vba pour la normalization

Sub NormaliserDonnéesParClientDiviserMax()

' Déclaration des variables

Dim wsFeuille As Worksheet

Dim iLigne As Long

Dim DerniereLigne As Long

Dim CodeClientCourant As String

Dim CAmax As Double

Dim EncaissementMax As Double

Dim CNEmax As Double

Dim CEmax As Double

Dim DMRecouvrementMax As Double

' Définir la feuille active

Set wsFeuille = [Link]("Feuil3") ' Remplacer "Feuille1" par le nom de votre

feuille

' Obtenir la dernière ligne du tableau de données

DerniereLigne = [Link]([Link], 1).End(xlUp).Row

' Parcourir chaque ligne du tableau de données

For iLigne = 2 To DerniereLigne

' Obtenir le code client de la ligne actuelle

CodeClientCourant = [Link](iLigne, 1).Value

' Initialiser les valeurs maximales

CAmax = [Link](iLigne, 3).Value

EncaissementMax = [Link](iLigne, 4).Value

CNEmax = [Link](iLigne, 5).Value

CEmax = [Link](iLigne, 6).Value

DMRecouvrementMax = [Link](iLigne, 8).Value

' Parcourir les lignes suivantes pour le même code client

For iLigneSuivante = iLigne + 1 To DerniereLigne

' Si le code client de la ligne suivante correspond au code client courant

If [Link](iLigneSuivante, 1).Value = CodeClientCourant Then

' Mettre à jour les valeurs maximales si nécessaire

CAmax = [Link](CAmax, [Link](iLigneSuivante,

3).Value)

EncaissementMax = [Link](EncaissementMax,
[Link](iLigneSuivante, 4).Value)

CNEmax = [Link](CNEmax, [Link](iLigneSuivante,

5).Value)

CEmax = [Link](CEmax, [Link](iLigneSuivante,

6).Value)

DMRecouvrementMax = [Link](DMRecouvrementMax,
[Link](iLigneSuivante, 8).Value)

End If
Next iLigneSuivante

' Normaliser les données pour le client courant

If CAmax <> 0 Then

[Link](iLigne, 3).Value = [Link](iLigne, 3).Value / CAmax

Else

[Link](iLigne, 3).Value = 0

End If

' Vérifier si EncaissementMax est différent de zéro avant de procéder à la division

If EncaissementMax <> 0 Then

[Link](iLigne, 4).Value = [Link](iLigne, 4).Value / EncaissementMax

Else

' Gérer le cas où EncaissementMax est égal à zéro, par exemple, en définissant la valeur normalisée
à zéro

[Link](iLigne, 4).Value = 0

End If

' Vérifier si CNEmax est différent de zéro avant de procéder à la division

If CNEmax <> 0 Then

[Link](iLigne, 5).Value = [Link](iLigne, 5).Value / CNEmax ' Créances Non Echues

Else

' Gérer le cas où CNEmax est égal à zéro, par exemple, en définissant la valeur normalisée à zéro

[Link](iLigne, 5).Value = 0

End If

' Vérifier si CEmax est différent de zéro avant de procéder à la division

If CEmax <> 0 Then

[Link](iLigne, 6).Value = [Link](iLigne, 6).Value / CEmax ' Créances Echues

Else

' Gérer le cas où CEmax est égal à zéro, par exemple, en définissant la valeur normalisée à zéro

[Link](iLigne, 6).Value = 0

End If

' Normaliser le Taux de recouvrement (généralement déjà une valeur entre 0 et 1)

' Vous pouvez adapter la normalisation en fonction de vos besoins

[Link](iLigne, 7).Value = [Link](iLigne, 7).Value ' Taux de recouvrement des

créances échues

' Vérifier si DMRecouvrementMax est différent de zéro avant de procéder à la division

If DMRecouvrementMax <> 0 Then

[Link](iLigne, 8).Value = [Link](iLigne, 8).Value / DMRecouvrementMax ' Délai

moyen du recouvrement en jour

Else

' Gérer le cas où DMRecouvrementMax est égal à zéro, par exemple, en définissant la valeur
normalisée à zéro

[Link](iLigne, 8).Value = 0

End If

Next iLigne

End Sub

Partie de vérification de la performance du

clusters :
Pour vérifier la performance des clusters, vous pouvez utiliser plusieurs techniques et métriques
d'évaluation. Voici un plan détaillé des étapes à suivre pour évaluer la qualité des clusters obtenus :
### 1. **Analyse des Clusters avec des Métriques de Cohésion et de Séparation**

1.1 Inertie Intra-cluster (Within-Cluster Sum of Squares, WCSS)

- **But :** Mesurer la compacité des clusters. Plus la somme des carrés des distances entre les
points de données et le centroïde de leur cluster est faible, mieux c'est.

- **Méthode :** Calculer la somme des distances euclidiennes au carré entre chaque point et le
centroïde de son cluster.

1.2 Distance Inter-cluster

- **But :** Mesurer la séparation entre les clusters. Des distances plus grandes entre les centroïdes
des clusters indiquent une meilleure séparation.

- **Méthode :** Calculer la distance entre les centroïdes de chaque paire de clusters.

1.3 Indice de Silhouette

- But : Évaluer la cohésion et la séparation des clusters.

- **Méthode :** Pour chaque point, calculer la silhouette score, qui prend en compte la distance
moyenne entre ce point et tous les autres points du même cluster et la distance moyenne entre ce
point et tous les points du cluster le plus proche.

```python

from [Link] import silhouette_score

# Supposons que 'data' est votre DataFrame et 'labels' sont les étiquettes des clusters

silhouette_avg = silhouette_score(data, labels)

print(f"Silhouette Score: {silhouette_avg}")

```

### 2. Validation des Clusters par la Méthode du Coude (Elbow Method)

- **But :** Déterminer le nombre optimal de clusters en trouvant le point où l'ajout de nouveaux
clusters n'améliore plus significativement l'inertie intra-cluster.

- **Méthode :** Tracer la courbe WCSS pour différents nombres de clusters et identifier le "coude"
de la courbe.

```python
import [Link] as plt

from [Link] import KMeans

wcss = []

for i in range(1, 11):

kmeans = KMeans(n_clusters=i, random_state=42)

[Link](data)

[Link](kmeans.inertia_)

[Link](range(1, 11), wcss)

[Link]('Méthode du Coude')

[Link]('Nombre de clusters')

[Link]('Inertie intra-cluster')

[Link]()

```

### 3. Evaluation par des Indices de Clustering

3.1 Indice de Davies-Bouldin

- **But :** Évaluer la qualité du clustering en se basant sur la ratio entre la somme des dispersions
intra-cluster et la séparation inter-cluster.

- Méthode : Calculer l'indice Davies-Bouldin pour les clusters.

```python

from [Link] import davies_bouldin_score

db_score = davies_bouldin_score(data, labels)

print(f"Davies-Bouldin Index: {db_score}")

```

3.2 Indice de Dunn

- **But :** Évaluer la séparation des clusters par rapport à leur compacité.

- Méthode : Calculer l'indice de Dunn (plus complexe à implémenter manuellement).

### 4. Visualisation des Clusters

4.1 Réduction de la Dimensionnalité

- **But :** Visualiser les clusters en 2D ou 3D pour interpréter visuellement la qualité du clustering.

- **Méthode :** Utiliser PCA (Principal Component Analysis) ou t-SNE (t-distributed Stochastic
Neighbor Embedding).

```python

from [Link] import PCA

import seaborn as sns

pca = PCA(n_components=2)

principal_components = pca.fit_transform(data)

[Link](figsize=(10, 7))

[Link](x=principal_components[:,0], y=principal_components[:,1], hue=labels,

palette='viridis')

[Link]('Visualisation des Clusters avec PCA')

[Link]()

```

### 5. Evaluation de la Stabilité des Clusters

5.1 Validation Croisée (Cross-Validation)

- **But :** Évaluer la stabilité des clusters sur différents sous-ensembles de données.

- **Méthode :** Appliquer le clustering sur plusieurs échantillons de données et comparer les
résultats.

**5.2 Comparaison des Clusters avec des Labels Connus (si disponibles)**
- **But :** Si vous avez des labels ou des catégories connues, comparer les clusters obtenus avec
les labels réels.

- **Méthode :** Utiliser des métriques telles que l'Adjusted Rand Index (ARI) ou l'Adjusted Mutual
Information (AMI).

```python

from [Link] import adjusted_rand_score

ari = adjusted_rand_score(true_labels, labels)

print(f"Adjusted Rand Index: {ari}")

```

### Conclusion

Ces techniques et métriques permettent de vérifier la performance et la qualité des clusters obtenus,
et de choisir le meilleur algorithme de clustering pour votre projet. Assurez-vous d'analyser et de
comparer les résultats de ces évaluations pour déterminer les clusters les plus appropriés pour
segmenter vos clients selon le niveau de risque.

𝔼𝕧𝕒𝕝𝕦𝕒𝕥𝕚𝕠𝕟 𝕄𝕖𝕥𝕙𝕠𝕕𝕤:

➊ Silhouette score:

A high Silhouette score (close to 1) indicates that data points within clusters are
similar, and that the normal data points are well separated from the anomalous ones.

➋ Calinski-Harabasz index:

Calinski-Harabasz Index measures the between-cluster dispersion against within-

cluster dispersion. A higher score signifies better-defined clusters.

➌ Davies-Bouldin index:

Davies-Bouldin Index measures the size of clusters against the average distance
between clusters. A lower score signifies better-defined clusters.

➍ Kolmogorov-Smirnov statistic:

It measures the maximum difference between the cumulative distribution functions

of the normal and anomalous data points.

➎ Precision at top-k:

The metric calculates the precision of the top-k anomalous data points using expert
domain knowledge.

Don't leave your unsupervised anomaly detection to chance because there are no
labels.

1)Segmentation :

*Intro :

Dans le cas où les données ne sont pas étiquetées, l'apprentissage non supervisé est
utilisé. Dans cette méthode, la machine a le pouvoir de déduire la variable
cible(target) des caractéristiques en regroupant ou en schématisant les données en
fonction de leurs similitudes, avec très peu d'intervention humaine. Deux grands
clans sont identifiés dans l'apprentissage non supervisé : le clustering et la réduction
de dimension.

*clustering :

C’est une technique couramment utilisée dans le domaine de l'apprentissage non supervisé afin de
regrouper les données non étiquetées d'un dataset en fonction de leur similitude en classes
homogènes. Il existe différents types de clustering, tels que le clustering hiérarchique et le clustering
partitionnel, qui reposent sur l'utilisation des centroïdes. L'exemple le plus connu est le clustering k-
means. Dans la même catégorie, on retrouve également le clustering basé sur la densité : les K-
médiods , Fuzzy C Mean Clustering

Figure 1

1-1) Clustering hiérarchique :

Contrairement à d'autres méthodes de regroupement qui génèrent des clusters en une
seule étape, les algorithmes de regroupement hiérarchique adoptent une méthode
progressive de formation de clusters. On peut distinguer deux catégories principales
d'algorithmes : le regroupement divisionnaire et le regroupement agglomératif.

1-1-1)Regroupement Divisionnaire :**

-Définition : Commence avec tous les points de données dans un seul cluster et les divise
récursivement en clusters plus petits jusqu'à ce que chaque point soit dans son propre
cluster ou qu'un critère d'arrêt soit atteint.
- Processus :Commence à la racine (ensemble des données) et se divise jusqu'aux feuilles
(points individuels).

1-1-2)Regroupement Agglomératif :
- Définition : Commence avec chaque point de données comme un cluster individuel et
fusionne itérativement les clusters les plus proches jusqu'à ce qu'un seul cluster reste ou que
le nombre désiré de clusters soit atteint.
- Processus : Commence aux feuilles (points individuels) et fusionne les clusters jusqu'à la
racine (ensemble des données).

Figure2
1-2) Clustering partitionnel :
1-2-1) K-means :
Le K-means est l’algorithme le plus célèbre dans l’apprentissage automatique non
Supervisé consiste à regrouper les données homogènes dans un nombre prédéterminé de
clusters ‘K’ distincts et qui ne chevauchent pas, la figure**** montre un
dataset avant et après l’utilisation du k-means.

Figure3
*Etapes de k-means :
L’algorithme de k-means clustering cherche à minimiser une fonction coût appelée

inertia et qui représente la somme des distances entre les points d’un cluster 𝑥 et le
centroïde de ce dernier .
La formule (*) représente la fonction coût de k-means (inertia) où :
n : le nombre de points du dataset
c : le centroïde de chaque cluster
i : fait référence à chaque point du dataset (i varie de 0 à n) [28].

ⅈ𝑛𝑒𝑟𝑡ⅈ𝑎 =∑𝑖𝑛=0min⁡(‖𝑥𝑖 − 𝑐𝑖‖2) …….(*)

Étape 1 : désigner le nombre de clusters ‘k’, cette désignation sera soit :
aléatoire ou par tâtonnement selon des connaissances précédentes sur la nature et la
distribution du dataset, elle peut même être faite par l'utilisation des techniques

d’apprentissages. Figure

Étape 2 : initialiser k centroïdes d’une manière

aléatoire dans la figure 23 Les points
roses représentent les centroïdes initiaux, où

k=3 et i =0...k . Figure

Étape 3 : cette étape englobe trois étapes principales qui vont être réitérées jusqu’à ce que
les centroïdes convergent vers une position d’équilibre.

* La somme des distances d au carré (inertia) entre chaque point de données 𝑥𝑖 et les k
centroïdes 𝑐𝑖 serait calculée en premier par la

formule ** ( figure ).
(𝑥𝑖 , 𝑐𝑖) = √(∑𝑗𝑑=1(𝑥𝑖1 − 𝑐𝑖1)) . . . . . . . . . (**)
i=1...N, j=1...k
*Afin d’optimiser la fonction coût (voirformule *), le centre de gravité sera attribué au

cluster le plus proche ( figure ).

*Enfin, Recalculer le nouveau centre de gravité ′𝑐𝑖 de chaque cluster i par la formule ***.

′𝑐𝑖 = 𝑚1𝑖 ∑𝑗𝑁𝑖=1 (𝑥𝑖 , 𝑐𝑖) . . . . . . . . . (***)

Où :

𝑑: la distances

𝑐𝑖 : le centroïde i

𝑚𝑖 : le nombre des points affecté au centroïde 𝑐𝑖

𝑥𝑖 : le point x affecté a ce centroïde

Etape 4 : itérer l'algorithme (répéter l'étape 3) jusqu'à ce que les centroïdes ne changent
plus de groupe.

Figure
1-2-2)k-médoide
Le principe de cette méthode est similaire à celui du k-means, à la différence près qu'il utilise
des objets représentatifs situés au centre d'un cluster, appelés médoïdes, au lieu des
centroïdes, afin de réduire la somme des dissemblances et de réduire le bruit et les valeurs
aberrantes.
Pour appliquer l’algorithme de k-médoïde il nous faut un dataset avec n éléments, et le
nombre de cluster à former k, pour procéder comme suite :
a. Sélectionné K points à partir du dataset comme des médoïdes initiaux.
b Attribuez chaque point de l'échantillon à un cluster en fonction du médoïde le plus proche.
c. Remplacer les médoïdes par d’autres points du dataset en minimisant le coût total
(somme des distances au médoïdes le plus proches).
d. Répétez les étapes 2 et 3 jusqu’à ce qu'il n'y ait plus de changement dans les médoïdes.
Figure

Vous aimerez peut-être aussi

Étape 1 Préparer La Feuille Données
Pas encore d'évaluation
Étape 1 Préparer La Feuille Données
3 pages
Kbac Manuel MDP 0122
Pas encore d'évaluation
Kbac Manuel MDP 0122
8 pages
Besions Finactes
Pas encore d'évaluation
Besions Finactes
4 pages
Comment Suivre Et Maîtriser Vos Risques Clients
Pas encore d'évaluation
Comment Suivre Et Maîtriser Vos Risques Clients
4 pages
L'approche RAROC
Pas encore d'évaluation
L'approche RAROC
7 pages
Gestion du Risque de Crédit et Techniques
Pas encore d'évaluation
Gestion du Risque de Crédit et Techniques
96 pages
Analyse Des Risques
Pas encore d'évaluation
Analyse Des Risques
209 pages
Chapitre 8 - Synthèse
Pas encore d'évaluation
Chapitre 8 - Synthèse
7 pages
Mot D'entreprise Premium
Pas encore d'évaluation
Mot D'entreprise Premium
16 pages
TD Cpai15 Carto
Pas encore d'évaluation
TD Cpai15 Carto
16 pages
Version Finale 1
Pas encore d'évaluation
Version Finale 1
37 pages
TPCT 2
Pas encore d'évaluation
TPCT 2
4 pages
Le Fonds de Roulement D'exploitation Normatif
Pas encore d'évaluation
Le Fonds de Roulement D'exploitation Normatif
18 pages
Le Crédit Scoring (Fontion Score)
Pas encore d'évaluation
Le Crédit Scoring (Fontion Score)
12 pages
Analyse du risque de liquidité
Pas encore d'évaluation
Analyse du risque de liquidité
6 pages
Projet Scoring
Pas encore d'évaluation
Projet Scoring
29 pages
Partiel Analyse Fi Corrigé 2023
Pas encore d'évaluation
Partiel Analyse Fi Corrigé 2023
6 pages
Gestion de La Trésorerie PDF
Pas encore d'évaluation
Gestion de La Trésorerie PDF
79 pages
Modèles de Notation pour GE & PME
Pas encore d'évaluation
Modèles de Notation pour GE & PME
25 pages
Ob - 3541ce - Guide Application de La Matrice Excel
Pas encore d'évaluation
Ob - 3541ce - Guide Application de La Matrice Excel
9 pages
1 Enoncé - EvalEntrainement - PSRFIRMS - MBAIF
Pas encore d'évaluation
1 Enoncé - EvalEntrainement - PSRFIRMS - MBAIF
12 pages
TD 2 Ratios Corrigé
Pas encore d'évaluation
TD 2 Ratios Corrigé
8 pages
Outils D Analyse A Revoir
Pas encore d'évaluation
Outils D Analyse A Revoir
6 pages
Anafin
Pas encore d'évaluation
Anafin
16 pages
Ai Vba Macro Automatisation Rapports Patrip 2
Pas encore d'évaluation
Ai Vba Macro Automatisation Rapports Patrip 2
4 pages
Cartographie Des Risques Excel - 2
80% (5)
Cartographie Des Risques Excel - 2
9 pages
Guide D'utilisation Dossier de Travail Inspection
Pas encore d'évaluation
Guide D'utilisation Dossier de Travail Inspection
18 pages
Étude de Cas
Pas encore d'évaluation
Étude de Cas
7 pages
Comment Bien Évaluer La Solvabilité D'un Client
Pas encore d'évaluation
Comment Bien Évaluer La Solvabilité D'un Client
8 pages
10 Macros Pour Responsable Administratif
Pas encore d'évaluation
10 Macros Pour Responsable Administratif
10 pages
Table-Des-Matieres Excel
Pas encore d'évaluation
Table-Des-Matieres Excel
17 pages
Corrigé Examen D'analyse Des Etats Financiers - SS2 - 09 - 24
Pas encore d'évaluation
Corrigé Examen D'analyse Des Etats Financiers - SS2 - 09 - 24
3 pages
Guide Excel pour Comptabilité Avancée
Pas encore d'évaluation
Guide Excel pour Comptabilité Avancée
105 pages
Outil Prévisionnel Financier Gratuit
0% (1)
Outil Prévisionnel Financier Gratuit
72 pages
Document
Pas encore d'évaluation
Document
2 pages
Analyse Financière et Solvabilité
Pas encore d'évaluation
Analyse Financière et Solvabilité
7 pages
Ouverture et Gestion de Comptes Entreprises
Pas encore d'évaluation
Ouverture et Gestion de Comptes Entreprises
15 pages
Diagnostic financier de la société ERAM
Pas encore d'évaluation
Diagnostic financier de la société ERAM
9 pages
Cours de Gestion Des Risques
Pas encore d'évaluation
Cours de Gestion Des Risques
19 pages
Risques Liés À La Gestion de La Trésorerie de L'entreprise: Fluctuation Du Cours de Change)
Pas encore d'évaluation
Risques Liés À La Gestion de La Trésorerie de L'entreprise: Fluctuation Du Cours de Change)
6 pages
Guide Excel pour Comptabilité d'Entreprise
Pas encore d'évaluation
Guide Excel pour Comptabilité d'Entreprise
75 pages
Contrôle de Gestion
Pas encore d'évaluation
Contrôle de Gestion
7 pages
Rapport de Projet 376
Pas encore d'évaluation
Rapport de Projet 376
18 pages
Gestion Du Risque Client
100% (1)
Gestion Du Risque Client
31 pages
3eco DS1 G1
Pas encore d'évaluation
3eco DS1 G1
1 page
Quick Devis V6 - ERP Interface
Pas encore d'évaluation
Quick Devis V6 - ERP Interface
19 pages
Comptes Annuels Complet
Pas encore d'évaluation
Comptes Annuels Complet
75 pages
Gestion du risque opérationnel à l'ENSAE
Pas encore d'évaluation
Gestion du risque opérationnel à l'ENSAE
12 pages
Classeur Audit Interne-1
Pas encore d'évaluation
Classeur Audit Interne-1
37 pages
Lessentiel de La Finance C3a0 Lusage Des Managers Part 20
Pas encore d'évaluation
Lessentiel de La Finance C3a0 Lusage Des Managers Part 20
267 pages
Modules et Fonctionnalités Comptables et de Gestion
Pas encore d'évaluation
Modules et Fonctionnalités Comptables et de Gestion
2 pages
Cout CMUP
Pas encore d'évaluation
Cout CMUP
9 pages
Tâches À Réaliser
Pas encore d'évaluation
Tâches À Réaliser
2 pages
Réunion AMENCAM : Performances PME
Pas encore d'évaluation
Réunion AMENCAM : Performances PME
9 pages
Corrige Examen de Controle Interne 2021
100% (1)
Corrige Examen de Controle Interne 2021
3 pages
Gestion Du Recouvrement
Pas encore d'évaluation
Gestion Du Recouvrement
98 pages
Cours - Méthodes D'évaluation Du Risque de Crédit
Pas encore d'évaluation
Cours - Méthodes D'évaluation Du Risque de Crédit
8 pages
Copie de 22.11.2022cas Pratique Cartographie Des R Liãs Aux Crãdits Aux Particuliers
Pas encore d'évaluation
Copie de 22.11.2022cas Pratique Cartographie Des R Liãs Aux Crãdits Aux Particuliers
31 pages
Exam SQL
Pas encore d'évaluation
Exam SQL
5 pages
Etude de Cas Biscuiterie
Pas encore d'évaluation
Etude de Cas Biscuiterie
2 pages
Cas Seuill de Rentabilité
Pas encore d'évaluation
Cas Seuill de Rentabilité
18 pages
Exam SQL
Pas encore d'évaluation
Exam SQL
3 pages
Org Partie2
Pas encore d'évaluation
Org Partie2
15 pages
Résumé Sensibilisation
Pas encore d'évaluation
Résumé Sensibilisation
2 pages
Introduction au Droit Bancaire au Maroc
Pas encore d'évaluation
Introduction au Droit Bancaire au Maroc
31 pages
Fiches de MR SABOUR Bac Blanc PC
Pas encore d'évaluation
Fiches de MR SABOUR Bac Blanc PC
9 pages
QCM UML et BPMN : Concepts Clés et Différences
Pas encore d'évaluation
QCM UML et BPMN : Concepts Clés et Différences
40 pages
Résumé Analyse Transactionnelle
Pas encore d'évaluation
Résumé Analyse Transactionnelle
3 pages
TD 1 Tableau de Bord-1
Pas encore d'évaluation
TD 1 Tableau de Bord-1
2 pages
Pricing Des Optionsfinal
Pas encore d'évaluation
Pricing Des Optionsfinal
31 pages
Org Partie1
Pas encore d'évaluation
Org Partie1
69 pages
Modélisation Merise et Requêtes SQL
100% (1)
Modélisation Merise et Requêtes SQL
2 pages
TD Estimation
Pas encore d'évaluation
TD Estimation
2 pages
Valorisation des actifs financiers
Pas encore d'évaluation
Valorisation des actifs financiers
62 pages
Examen Statistiques 2 Bac Eco 2013 Session Normale Corrige
Pas encore d'évaluation
Examen Statistiques 2 Bac Eco 2013 Session Normale Corrige
5 pages
Calculs Stochastiques FID 2019-2020
Pas encore d'évaluation
Calculs Stochastiques FID 2019-2020
25 pages
Cours JAVA 5 - Exception
Pas encore d'évaluation
Cours JAVA 5 - Exception
38 pages
Modélisation Merise et SQL pour Projets
Pas encore d'évaluation
Modélisation Merise et SQL pour Projets
5 pages
Les Examens (2014 - 2022)
Pas encore d'évaluation
Les Examens (2014 - 2022)
10 pages
2014 2015 Eg l1 s1 CC Microeconomie Correction
Pas encore d'évaluation
2014 2015 Eg l1 s1 CC Microeconomie Correction
7 pages
TD Avantage Comparatifs Et Absolus
Pas encore d'évaluation
TD Avantage Comparatifs Et Absolus
3 pages
Rattrapage Réseaux et Transmission GEI
Pas encore d'évaluation
Rattrapage Réseaux et Transmission GEI
3 pages
Session1 2011 2012
Pas encore d'évaluation
Session1 2011 2012
6 pages
ACP Excel Xnumbers
Pas encore d'évaluation
ACP Excel Xnumbers
15 pages
Introduction au Data Mining
Pas encore d'évaluation
Introduction au Data Mining
47 pages
TD Data Mining - Seance 8
Pas encore d'évaluation
TD Data Mining - Seance 8
4 pages
Systèmes d'Information et BI par Imade Benelallam
Pas encore d'évaluation
Systèmes d'Information et BI par Imade Benelallam
81 pages
FSEG 2024-2025 - Livret de Formation - L3
Pas encore d'évaluation
FSEG 2024-2025 - Livret de Formation - L3
72 pages
Institut International de Management
Pas encore d'évaluation
Institut International de Management
27 pages
Introduction au Data Mining
Pas encore d'évaluation
Introduction au Data Mining
51 pages
Méthodes Ensemble
Pas encore d'évaluation
Méthodes Ensemble
7 pages
Le Data Mining, Par Antoine-Eric Sammartino
Pas encore d'évaluation
Le Data Mining, Par Antoine-Eric Sammartino
4 pages
Cours1 Regles Association
Pas encore d'évaluation
Cours1 Regles Association
23 pages
TP 2
Pas encore d'évaluation
TP 2
4 pages
Projets Vision par Ordinateur Étudiants
Pas encore d'évaluation
Projets Vision par Ordinateur Étudiants
4 pages
Master Intelligence Artificielle Ingenierie
Pas encore d'évaluation
Master Intelligence Artificielle Ingenierie
50 pages
TD - Classification Hiérarchique Ascendante
Pas encore d'évaluation
TD - Classification Hiérarchique Ascendante
2 pages
Techniques de Data Mining Essentielles
Pas encore d'évaluation
Techniques de Data Mining Essentielles
20 pages
Introduction au Data Mining et Concepts de Base
Pas encore d'évaluation
Introduction au Data Mining et Concepts de Base
8 pages
Approche systémique pour l'analyse de données
Pas encore d'évaluation
Approche systémique pour l'analyse de données
34 pages
Big Data et Machine Learning en Data Science
100% (1)
Big Data et Machine Learning en Data Science
10 pages
Memoire 2 ACP
Pas encore d'évaluation
Memoire 2 ACP
59 pages
Chapitre 2 Classification
Pas encore d'évaluation
Chapitre 2 Classification
32 pages
Introduction à l'Informatique Décisionnelle
Pas encore d'évaluation
Introduction à l'Informatique Décisionnelle
65 pages
Pfe PDF
Pas encore d'évaluation
Pfe PDF
37 pages
TP2 - Python
Pas encore d'évaluation
TP2 - Python
4 pages
Cours de Methodologie Du Travail
Pas encore d'évaluation
Cours de Methodologie Du Travail
45 pages
TP3 IngSI
100% (1)
TP3 IngSI
5 pages
cst1 Hugo
Pas encore d'évaluation
cst1 Hugo
6 pages
Data Mining
Pas encore d'évaluation
Data Mining
91 pages
Examens Énergétiques Renouvelables Et Durables: Chunming Tu, Xi He, Zhikang Shuai, Fei Jiang
Pas encore d'évaluation
Examens Énergétiques Renouvelables Et Durables: Chunming Tu, Xi He, Zhikang Shuai, Fei Jiang
9 pages
01 Introduction DM
Pas encore d'évaluation
01 Introduction DM
26 pages
02-Entrepôt de Données (DW)
Pas encore d'évaluation
02-Entrepôt de Données (DW)
89 pages

Clustering

Transféré par

Clustering

Transféré par

Data 2021 :

- Cluster 0 : Risque modéré

- Solde relativement élevé

- Chiffre d'affaires (CA) moyen

- Nombre élevé de créances non échues

- Taux de recouvrement des créances échues élevé

- Délai de recouvrement en jours moyen à élevé

- Caution modérée à élevée

- Cluster 1 : Risque faible

- Solde très faible

- Chiffre d'affaires (CA) bas

- Aucune créance non échue

- Aucune créance échue

- Taux de recouvrement des créances échues élevé

- Délai de recouvrement en jours très faible

- Cluster 2 : Risque très faible

- Chiffre d'affaires (CA) bas

- Aucune créance non échue

- Aucune créance échue

- Taux de recouvrement des créances échues élevé

- Délai de recouvrement en jours faible

- Cluster 3 : Risque élevé

- Chiffre d'affaires (CA) moyen à élevé

- Nombre modéré de créances non échues

- Nombre élevé de créances échues

- Taux de recouvrement des créances échues élevé

- Délai de recouvrement en jours élevé

- **Cluster 0 : Risque très faible**

- Solde très faible

- Chiffre d'affaires (CA) très bas

- Encaissements très bas

- Aucune créance non échue

- Aucune créance échue

- Taux de recouvrement des créances échues élevé

- **Cluster 1 : Risque faible**

- Chiffre d'affaires (CA) moyen à élevé

- Encaissements moyens à élevés

- Aucune créance non échue

- Aucune créance échue

- Taux de recouvrement des créances échues élevé

- Délai de recouvrement en jours très faible

- ** Cluster 3: Risque modéré à élevé**

- Chiffre d'affaires (CA) moyen

- Nombre moyen de créances non échues

- Nombre élevé de créances échues

- Taux de recouvrement des créances échues élevé

- Délai de recouvrement en jours élevé

- ** Cluster 2: Risque élevé**

- Chiffre d'affaires (CA) élevé

- Nombre élevé de créances non échues

- Aucune créance échue

- Taux de recouvrement des créances échues élevé

- Délai de recouvrement en jours moyen à élevé

Code : vba pour la normalization

' Déclaration des variables

Dim wsFeuille As Worksheet

Dim iLigne As Long

Dim DerniereLigne As Long

Dim CodeClientCourant As String

Dim CAmax As Double

Dim EncaissementMax As Double

Dim CNEmax As Double

Dim CEmax As Double

Dim DMRecouvrementMax As Double

' Définir la feuille active

Set wsFeuille = [Link]("Feuil3") ' Remplacer "Feuille1" par le nom de votre

' Obtenir la dernière ligne du tableau de données

DerniereLigne = [Link]([Link], 1).End(xlUp).Row

' Parcourir chaque ligne du tableau de données

For iLigne = 2 To DerniereLigne

' Obtenir le code client de la ligne actuelle

' Initialiser les valeurs maximales

CAmax = [Link](iLigne, 3).Value

EncaissementMax = [Link](iLigne, 4).Value

CNEmax = [Link](iLigne, 5).Value

CEmax = [Link](iLigne, 6).Value

- Cluster 0 : Risque très faible

- Cluster 1 : Risque faible

- Cluster 3: Risque modéré à élevé

- Cluster 2: Risque élevé

1.1 Inertie Intra-cluster (Within-Cluster Sum of Squares, WCSS)

1.2 Distance Inter-cluster

1.3 Indice de Silhouette

- But : Évaluer la cohésion et la séparation des clusters.

### 2. Validation des Clusters par la Méthode du Coude (Elbow Method)

### 3. Evaluation par des Indices de Clustering

3.1 Indice de Davies-Bouldin

- Méthode : Calculer l'indice Davies-Bouldin pour les clusters.

3.2 Indice de Dunn

- Méthode : Calculer l'indice de Dunn (plus complexe à implémenter manuellement).

### 4. Visualisation des Clusters

4.1 Réduction de la Dimensionnalité

### 5. Evaluation de la Stabilité des Clusters

5.1 Validation Croisée (Cross-Validation)