Se servir de Sketch Engine pour créer son propre corpus thématique
Avez-vous cherché en vain le corpus qu’il vous faut ? Êtes-vous intéressé·e par le discours spécialisé ? Sketch Engine dispose d’un outil de création automatique de corpus qui se charge de trouver sur Internet des textes qui sont pertinents pour vous, de les télécharger et d’en faire un corpus.
Ce tutoriel d’une durée de 5 minutes explique comment on peut créer un corpus à l’aide de Sketch Engine.
Comment se servir de l’outil de création de corpus
Identifiez-vous, choisissez l’outil de sélection de corpus en haut et cliquez sur NOUVEAU CORPUS.
Donnez un nom à votre corpus, choisissez la langue, rajoutez une description (facultatif) et cliquez sur SUITE
Cliquez sur Trouver des textes sur Internet. Vous pouvez aussi rajouter vos propres données au corpus ou faire un corpus uniquement constitué de vos propres données en cliquant sur J’ai mes propres textes.
Choisissez la façon dont les textes doivent être repérés sur Internet :
- recherche sur Internet – taper des mots-clés et des suites de mot qui définissent le sujet
- URLs – indiquer une liste de pages Internet à télécharger
- Site internet – indiquer l’adresse d’un site Internet permettant d’obtenir jusqu’à 2000 documents à partir de ce site
Pour se servir de la fonctionnalité recherche sur Internet, tapez des mots et des suites de mots, actionnez pour chacun d’entre eux la touche ENTRÉE et cliquez sur ALLER. Sketch Engine interagit avec Bing pour trouver des pages pertinentes et pour les télécharger. Cliquez sur Suite quand le téléchargement est terminé.
Vous pouvez alors ajouter encore d’autres textes, tout de suite ou plus tard. Cliquez sur COMPILER pour transformer les données en un corpus.
Maintenant, votre corpus est prêt.
Cliquez sur TABLEAU DE BORD DES CORPUS pour commencer à travailler avec le corpus. La fonctionnalité EXTRAIRE DES MOTS-CLÉS & EXPRESSIONS affichera les mots qui sont caractéristiques pour votre corpus ce qui permettra de vérifier si le corpus couvre de façon satisfaisante votre sujet. La fonctionnalité DÉTAILS DU CORPUS ET STATISTIQUES met à disposition des comptages de mots et d’autres statistiques concernant votre corpus.
Des corpus à partir de fichiers, URLs ou mémoires de traduction
Vous pouvez également créer des corpus à partir d’autres sources :
- des fichiers et des documents que l’on peut déposer sur Sketch Engine
- à partir d’une liste de pages Internet constituée par les usagers
- à partir de la mémoire de traduction de votre outil CAT
Pour aller plus loin dans le domaine des corpus des utilisateurs, merci de consulter le Manuel des utilisateurs.