La France dispose d'une base de données extraordinaire gérées par l'INSEE et qui reprend la totalité des entités économiques françaises en activité ou non. Cette donnée publique est accessible plus facilement depuis l'avènement de l'Open-Data et permet aux professionnels d'enrichir leurs bases de données propres via le traitement de SIRETISATION.
1-Les données disponibles pour enrichir votre base.
Voici la liste non exhaustive des champs les plus importants disponibles dans la base SIRENE.
Numéro de SIREN | Numéro de SIREN, identifiant du groupe – en savoir plus |
Numéro de SIRET | Numéro SIRET, identifiant unique de l’établissement – en savoir plus |
Dernier Evènement | Libellé de l'événement (Déménagement, fermeture…) |
Date du dernier Evènement | Date de l'événement listé plus haut |
Raison sociale | Raison sociale de l’établissement, exemple DURAND SARL |
Enseigne | Enseigne, exemple DECATHLON |
Sigle | Sigle, exemple SNCF |
Adresse 3 | Bâtiment de l’adresse normalisée selon le référentiel postal |
Adresse 4 | Voie de l’adresse normalisée selon le référentiel postal |
Adresse 5 | Lieu-dit, BP de l’adresse normalisée selon le référentiel postal |
Code postal (pas le code INSEE) | Code postal de l’adresse normalisée selon le référentiel postal |
Commune | Ville de l’adresse normalisée selon le référentiel postal |
Code APE sur 5 caractères | Code NAF établissement – en savoir plus |
Code APE sur 2 caractères | Code NAF entreprise – en savoir plus |
Tranche d'effectif salarié du site | Tranche d'effectif établissement |
Tranche d'effectif salarié du siège | Tranche d'effectif entreprise au global siège + établissements |
Date de création du site | Date de création établissement |
Date de création du siège | Date de création entreprise |
Catégorie juridique | catégorie juridique |
Type d'établissement | 1 : siège ; 2 : Ets secondaire |
Nombre d'établissements | Nombre d'établissements |
On peut y trouver également des informations hors base SIRENE, comme les coordonnées du dirigeant ou des informations liées à la personne morale. Ces données ne concernent pas les salariés.
TELEPHONE | Ligne du standard de l'entreprise |
Email générique de l'entreprise | |
SITE | Site web de l'entreprise |
CIVILITE DU DIRIGEANT | Mr, Mme |
PRENOM DU DIRIGEANT | Prénom du principal dirigeant |
NOM DU DIRIGEANT | Nom du principal dirigeant |
2-Comment fonctionne le traitement de sirétisation?
-Traitement de masse de votre base de données
Traitement automatique : Ce traitement consiste à comparer en une seule fois votre base client/prospect avec la dernière version à jour de la base Sirene. Pour les pros du marketing direct, cela ressemble à une déduplication postale, puisqu'on va calculer un score de probabilité que l'adresse de votre fichier soit bien celle trouvée dans le référentiel INSEE.
C'est sur la qualité de ce traitement que vous devez choisir votre prestataire, la donnée enrichie étant de même qualité, puisque puisée à la même source. N'hésitez donc pas à faire tester un échantillon voire, toute la base, pour obtenir ce fameux taux de rapprochement. En effet, plus ce taux est bas, plus vous aurez de rapprochement manuel à fournir. Les taux de rapprochement dépendent essentiellement de la qualité initiale de votre base et varient entre 50 et 100% de rapprochement.
Traitement semi-automatique : ce traitement consiste à réduire les critères de rapprochement du score pour augmenter artificiellement le nombre d'adresses rapprochées. On va ainsi accepter des raisons sociales proches, des adresses approximatives...
Traitement manuel : souvent pratiqué offshore dans des pays à bas coût, ce traitement est coûteux et donne peu de résultat. Il consiste à faire des recherches manuelles dans la base SIRENE. Les données compliquées à récupérer sont souvent liées à des erreurs de saisie, des raisons sociales erronées (enseigne, nom du dirigeant, intitulé flou comme CCAS) ou des adresses manquantes et/ou incomplètes.
Voir notre article sur la sirétisation
Traitement au fil de l’eau par webservice : on peut mener le même type de traitement de sirétisation à chaque création ou modification d’un enregistrement de la base. Pour ce faire, on va ajouter des scripts aux formulaires des sites et des applications comme la CRM et l’ERP. Ce type de mise en place est intéressante si un volume conséquent de fiches est créé ou modifié.
3-Ma base est enrichie en SIRET, que dois-je faire lors de l'intégration?
Voici les premières actions à mener une fois le fichier enrichi.
-Supprimer les évènements "fermeture"
Il faut supprimer les prospects ou clients inactifs cessés ou liquidés sans hésiter.
Soyez plus prudent avec les clients actifs dans la dernière année ; il se pourrait que certains aient des commandes en cours ou que le rapprochement ait commis une erreur due à un doublon.
-Modifier les adresses des sociétés "déménagées"
Il faut modifier les prospects ou clients inactifs déménagés sans hésiter.
Soyez plus prudent avec les clients actifs dans la dernière année pour les mêmes raisons que plus haut.
-Dédoublonnage des Sirets en doublon
Vous pouvez, si votre informatique le permet, fusionner les comptes clients/prospects ayant le même Siret – en savoir plus sur le code SIRET
-Regrouper les sociétés ayant le même Siren, dans un groupe capitalistique
Attribution d’un même groupe à tous les établissements avec le même code SIREN.
Par exemple, le groupe DECATHLON a comme SIREN 306 138 900.
-Regrouper les sociétés ayant la même enseigne, dans un groupe de marque
Attribution d’un même groupe à tous les établissements avec la même enseigne.
Par exemple, le groupe AFFLELOU. L'enseigne transcende les franchisés.
-Mettre en place une segmentation métier basée sur les codes NAF
Voir notre article sur la segmentation
-Faire un profiling de la base pour déterminer les codes NAF les plus porteurs en prospection.
Voir notre article sur le profiling
4-Les autres traitements possibles une fois ma base enrichie en numéro de siret
Acquisition de lignes supplémentaires (Siren d'un même groupe, NAF porteurs, société d'une même enseigne) pour enrichir la base - voir notre article sur l'appending
Acquisition de données supplémentaires pour enrichir la base existante
-Données comptables et d’assurance crédit (CA, Bilan, stock, part de CA export...)
Voir notre article sur l'appending
-Acquisition de données marketing et commerciales (Contact, fonction, email, téléphone...)
Attention, ces données sont personnelles et concernées par le nouveau Réglement Européen de Protection de Données (RGPD)
Sommaire
Introduction
La France dispose d’une grande base de données gérée par l’INSEE et qui reprend la totalité des entités économiques françaises en activité ou non. Cette donnée publique est accessible plus facilement depuis l’avènement de l’Open-Data et permet aux professionnels d’enrichir leurs bases de données propres via le traitement de SIRETISATION.
Qu’est-ce que la sirétisation ?
La sirétisation ou sirenage consiste à rapprocher une base de données commerciales de clients/prospects du référentiel SIREN de l’INSEE.
Le SIREN (Système d’Identification du Répertoire des ENtreprises) est un nombre composé de 9 chiffres attribué aux entreprises ou association par l’INSEE au moment de leur création. Ce numéro d’identification est commun à tous les établissements de l’entreprise ; c’est à dire au siège et à ses établissements secondaires.
Le SIRET (système d’identification du répertoire des établissements) se compose quant à lui de 14 chiffres. Les 9 premiers correspondent au SIREN puis les 5 suivant sont le numéro NIC (Numéro Internet de Classement) qui différencie les établissements de l’entreprise. Le SIRET est unique pour chaque établissement, à l'image de votre numéro de sécurité sociale.
SIRET = SIREN + NIC
L’objectif de la sirétisation est donc d’attribuer un numéro de SIRET à chaque ligne analysée, c’est à dire un établissement au sens INSEE. Une fois ce SIRET attribué, il est possible d’enrichir la ligne d’un tas d’informations liées.
Les données disponibles pour enrichir votre base.
Voici la liste non exhaustive des champs les plus importants disponibles dans la base SIRENE.
Numéro de SIREN | Identifiant du groupe – en savoir plus |
Numéro de SIRET | Identifiant unique de l’établissement – en savoir plus |
Dernier événement | Libellé de l'événement (déménagement, fermeture…) |
Date du dernier événement | Date de l'événement listé plus haut |
Raison sociale | Raison sociale de l’établissement, exemple DURAND SARL |
Enseigne | Enseigne, Exemple DECATHLON |
Sigle | Sigle, Exemple SNCF |
Adresse 3 | Bâtiment de l’adresse normalisée selon le référentiel postal |
Adresse 4 | Voie de l’adresse normalisée selon le référentiel postal |
Adresse 5 | Lieu-dit, BP de l’adresse normalisée selon le référentiel postal |
Code postal (pas le code INSEE) | Code postal de l’adresse normalisée selon le référentiel postal |
Commune | Ville de l’adresse normalisée selon le référentiel postal |
Code APE sur 5 caractères | Code NAF établissement – en savoir plus |
Code APE sur 2 caractères | Code NAF entreprise – en savoir plus |
Tranche d'effectif salarié du site | Tranche d'effectif établissement |
Tranche d'effectif salarié du siège | Tranche d'effectif entreprise au global siège + établissements |
Date de création du site | Date de création établissement |
Date de création du siège | Date de création entreprise |
Catégorie juridique | catégorie juridique |
Type d'établissement | 1 : siège ; 2 : Ets secondaire |
Nombre d'établissements | Nombre d'établissements |
On peut y trouver également des informations hors base SIRENE, comme les coordonnées du dirigeant ou des informations liées à la personne morale. Ces données ne concernent pas les salariés.
Téléphone | Ligne du standard de l'entreprise |
Email générique de l'entreprise | |
Site | Site web de l'entreprise |
Civilité du dirigeant | Mr, Mme |
Prénom du dirigeant | Prénom du principal dirigeant |
Nom du dirigeant | Nom du principal dirigeant |
Comment fonctionne la sirétisation ?
En savoir plus sur la sirétisation d'un fichier client
La sirétisation est une opération qui demande du temps de traitement et elle se déroule en trois grandes étapes :
La phase automatique
Elle permet de traiter la majeure partie du fichier (entre 70% et 80%). Ce traitement consiste à comparer en une seule fois votre base client/prospect avec la dernière version à jour de la base SIRENE. Le traitement se base sur un algorithme qui tentera de faire matcher chaque ligne de votre fichier avec le référentiel INSEE. Ce processus permet de déterminer un taux de rapprochement, également appelé taux de match, qui permet aussi d’évaluer la qualité de votre fichier. C’est par rapport à la qualité de ce traitement que vous devez choisir votre prestataire. En effet, la donnée enrichie reste de même qualité puisque qu'elle est toujours puisée à votre base de données.
N’hésitez donc pas à faire tester un échantillon voire, toute la base pour obtenir ce taux de rapprochement. Sachez que plus ce dernier est bas, plus vous aurez de rapprochement manuel à fournir. Les taux de rapprochement dépendent essentiellement de la qualité initiale de votre base et varient entre 50 et 100% de rapprochement.
La phase semi-automatique
Ce traitement consiste à réduire les critères de rapprochement du score pour augmenter artificiellement le nombre d’adresses rapprochées. On va ainsi accepter des raisons sociales proches, des adresses approximatives…
La phase manuelle
Comme son nom l’indique, cette étape consiste en une recherche manuelle des dernières lignes non retrouvées. Cette phase est longue et souvent coûteuse car elle fait appel à un opérateur qui travaillera ligne par ligne pour relier vos données et celle du référentiel INSEE. Les données compliquées à récupérer sont souvent liées à des erreurs de saisie, des raisons sociales erronées (enseigne, nom du dirigeant, intitulé flou comme CCAS) ou des adresses manquantes et/ou incomplètes. Cette phase manuelle sera utilisée en dernier recours lorsque les lignes restantes ne peuvent être laissées pour compte.
Enfin, malgré les 3 phases il restera toujours des données non rapprochables de la base de données INSEE (comme les particuliers, certaines associations, certains établissements publics ou des sociétés étrangères).
Traitement au fil de l’eau par webservice
On peut mener le même type de traitement de sirétisation à chaque création ou modification d’un enregistrement de la base. Pour ce faire, on va ajouter des scripts aux formulaires des sites et des applications comme la CRM et l’ERP. Ce type de mise en place est intéressante si un volume conséquent de fiches est créé ou modifié.
Ma base est enrichie en SIRET, que dois-je faire lors de l’intégration ?
Voici les premières actions à mener une fois le fichier enrichi.
Supprimer les évènements “fermeture”
Il faut supprimer les prospects, clients inactifs cessés ou liquidés sans hésiter. Soyez plus prudent avec les clients actifs dans la dernière année ; il se pourrait que certains aient des commandes en cours ou que le rapprochement ait commis une erreur due à un doublon.
Modifier les adresses des sociétés “déménagées”
Il faut modifier les prospects ou clients inactifs déménagés sans hésiter. Soyez plus prudent avec les clients actifs dans la dernière année pour les mêmes raisons que plus haut.
Dédoublonnage des Sirets en doublon
Vous pouvez, si votre informatique le permet, fusionner les comptes clients/prospects ayant le même SIRET.
Regrouper les sociétés ayant le même SIREN, dans un groupe capitalistique
Attribution d’un même groupe à tous les établissements avec le même code SIREN. Par exemple, le groupe DECATHLON a comme SIREN 306 138 900.
Regrouper les sociétés ayant la même enseigne, dans un groupe de marque
Attribution d’un même groupe à tous les établissements avec la même enseigne. Par exemple, le groupe AFFLELOU. L’enseigne transcende les franchisés.
Mettre en place une segmentation métier basée sur les codes NAF
Voir notre article sur la segmentation
Faire un profiling de la base pour déterminer les codes NAF les plus porteurs en prospection.
Les autres traitements possibles une fois ma base enrichie en numéro de SIRET
La sirétisation peut servir à plusieurs services d’une entreprise, que ce soit la comptabilité, le marketing ou encore la DSI.
Le traitement peut intervenir comme une étape lors de la mise en place d’un logiciel de gestion. On fait alors appel au sirenage pour nettoyer et injecter des données complètes et propres. Si les logiciels sont déjà en place, on parlera alors de mise à jour de votre CRM ou autres outils de la relation client.
En plus de présenter de nombreux avantages : nettoyer votre base de données des sociétés fermées, identifier les doublons dans votre base, récupérer les adresses des sociétés déménagées, identifier les établissements appartenant à un même groupe… Le Numéro de SIRET permettra d’enrichir votre base de données en informations complémentaires tels que les numéros de TVA intracommunautaire, les emails, le téléphone, le chiffre d’affaires, le score financier, etc.
Acquisition de lignes supplémentaires (SIREN d’un même groupe, NAF porteurs, société d’une même enseigne) pour enrichir la base – Voir notre article sur l'appending
Acquisition de données supplémentaires pour enrichir la base existante
Données comptables et d’assurance-crédit (CA, Bilan, stock, part de CA export…)
Voir notre article sur l'appending
Acquisition de données marketing et commerciales (Contact, fonction, email, téléphone…)
Attention, ces données sont personnelles et concernées par le nouveau Réglement Européen de Protection de Données (RGPD)