Télécharger le corpus et les scripts


Afin de contribuer à l’ouverture et au partage des données,
Drama Critiques met à disposition non seulement une partie de sa base de données (plus de 36 000 critiques en accès libre, l’intégralité du corpus est disponible sur demande), mais aussi tous les scripts qui ont permis la réalisation des analyses techniques. Ce corpus est également téléchargeable sur Zenodo (Licence : Creative Commons Attribution 4.0 International). Vous pouvez ainsi implémenter
.
à nouveau tous les algorithmes sur l’ensemble du corpus pour mieux
comprendre les résultats, ou les adapter à vos propres données. Cela nous permet également d’assurer la transparence de nos résultats. La finalité de cette page est de permettre à toutes celles et à tous ceux qui aimeraient travailler aussi bien en littérature qu’en informatique de bénéficier d’un large corpus entièrement propre (plus de 1 400 heures de nettoyage) et novateur.

Pour télécharger le corpus sur le journalisme :
drama_critiques_CORPUS_I
Pour télécharger le corpus sur les blogs :
drama_critiques_CORPUS_II
Pour télécharger tous les scripts :
drama_critiques_scripts
Pour télécharger l’application « Derrière la machine »
Derrière_la_machine