Le corpus d'un peu plus de 2 millions d'occurrences s'étend sur 11 années de parution. Il est numérisé par Persée et produit sous deux formes XML-TEI propres à Persée :
Les deux versions du corpus ont été déposées dans le répertoire partagé de projets Cactus : '///Projets/Textométrie/SpUV/BHE'.
Le corpus numérisé est par ailleurs accessible à partir d'une connexion avec l'application jGalith de Persée.
Voir le chantier d'import du corpus BAIP.