API recherche-entreprise

Producteur : La Fabrique

API recherche entreprise permets aux administrations d’avoir des informations relatives aux entreprises en France.

This is a hidden anchor. It is a trick to avoid having the header hiding the top of the page.

Description

API de recherche d'entreprise basée sur ElasticSearch et exploitant les données de la base SIRENE de l'INSEE, de plusieurs jeux de données data.gouv.fr et de kali-data pour les conventions collectives.

Un frontend de démo est disponible ici : https://recherche-entreprises.fabrique.social.gouv.fr

Une API de démo est disponible sur https://api.recherche-entreprises.fabrique.social.gouv.fr

https://github.com/socialgouv/recherche-entreprises

Le dépôt de code contient plusieurs composants utilisables indépendamment :

L'étape d'indexation peut être automatisée pour maintenir les données à jour en continu (ex: hebdomadaire).

Image

Pour lancer les différentes parties du projet, un certain nombre d'outil doivent être présent sur la machine:

  • node
  • yarn
  • docker et docker-compose
  • wget
  • sqlite3

Le script index/sqlite/build.sh permet de permet de télécharger les CSV puis aggréger les données pour les re-exporter dans CSV "plat". Le fichier ./data/assembly.csv généré fait +6Go avec plus de 30 millions de lignes.

Cette opération peut durer ~45 minutes selon votre setup

Cette étape permet de mettre à jour les données dans l'index Elasticsearch à partir du fichier assembly.csv généré à l'étape précédente.

La mise à jour exploite la fonctionnalité alias d'Elasticsearch pour éviter les downtimes.

Pour lancer une indexation :

yarn ELASTICSEARCH_URL=https://elastic_url:9200 ELASTICSEARCH_API_KEY=key_with_writing_rights ASSEMBLY_FILE=./data/assembly.csv yarn start

Le script scripts/create-es-keys.sh permet de créer des tokens pour lire/écrire sur ces index. Cette étape n'est pas nécessaire pour le développement local.

Cette étape permet de lancer l'API de démo qui va servir les requêtes jusqu'à Elasticsearch.

En partant de la racine du projet

cd api

yarn install yarn build

ELASTICSEARCH_URL=http://localhost:9200 yarn start

Le temps d'indexation est d'environ 1h.

Des workflows GitHub permettent de mettre à jour les index et sont lancés manuellement

👋
Est-ce que cette page vous a été utile ?

Accéder à la ressource

La ressource est ouverte à tous. Vous pouvez y accéder dès maintenant :

L’équipe

Cette ressource est produite par :

Le contact de cette API n'est pas disponible publiquement.

Documentation technique

Vous êtes développeur ou architecte ? Partagez la documentation avec votre équipe :

L’API en détail

La disponibilité sur le dernier mois n'est pas communiquée
Les limites d’utilisation de cette API ne sont pas communiquées

Partenaires

Cette API ne recense pas ses partenariats publiquement.