Corpus Vieillissement

Documents ISTEX sur le vieillissement

v2

Nombre de documentsistex:quantityOfItems
/api/run/count-all
Description du corpus

Type de corpusdcterms:type
Corpus thématique
Domaine(s)dbpedia:domain
  • Sciences de la vie
  • Psychologie / Médecine
  • Gérontologie / Gériatrie
Anglais
Destinataire(s)istex:addressee
  • Laboratoire Lorrain de Recherche en Informatique et ses Applications (LORIA)
  • Analyse et Traitement Informatique de la Langue Française (ATILF)
  • Institut de l'Information Scientifique et Technique (Inist-CNRS)

qui ont mené conjointement le projet ISTEX-R.

Ce corpus a été utilisé par ISTEX-R pour développer et tester un algorithme de diachronie dans le but de caractériser l’évolution des recherches et des connaissances dans le temps. Lors de la ré-extraction du corpus et suite à des modifications opérées dans ISTEX sur les éditeurs scientifiques, seuls 8707 documents de la deuxième version ont été retrouvés. Ils constituent le corpus présenté ici.

ISTEX-R est un projet de recherche appliquée dont l’objectif est d'intégrer et mettre à disposition des outils d'accès au contenu, opérer sur des textes intégraux et construire des connaissances et les capitaliser essentiellement sur des domaines scientifiques ou techniques ainsi que la construction d’un démonstrateur.

  • Analyse diachronique de la thématique du vieillissement dans la Recherche.
  • Enrichissements linguistiques et terminologiques de données textuelles. Extraction terminologique en collaboration avec le Laboratoire Informatique de Nantes-Atlantiques (LINA).
  • Fouille de données.
Méthode de constitution du corpus

Critères
  • Le corpus Vieillissement a été constitué avant que l'API d'ISTEX soit accessible. Le choix des documents s'est opéré au départ sur les revues classées dans les catégories \"Gerontology\" et \"Nursing\" du Web of Science.
  • Il a été augmenté avec des documents contenant un texte de taille moyenne (2000 à 500000 caractères) et un résumé et dans lesquels était recherchée une liste de mots-clés.
  • La recherche de ces mots-clés pondérés s'effectuait dans le titre et le résumé.
Liste des identifiants

NB : Si vous souhaitez utiliser ce corpus pour vos besoins de recherche, téléchargez le fichier.corpus (en cliquant sur l'icône de la liste des identifiants) qui vous permettra d'extraire le corpus via le moissonneur HarvestCorpus. Voir la documentation : https://doc.istex.fr/tdm/extraction/harvest-corpus.pl.html

Comment citer ce corpus

Institut de l'information scientifique et technique - UPS 76 (Inist-CNRS) (2018) : Corpus Vieillissement. ISTEX - data.istex.fr, https://vieillissement-collection.corpus.istex.fr/ark:/67375/WCV-PVGDJ782-S

Inist-CNRS
Contributeur(s)dcterms:contributor
  • Guibon, Gaël (collecteur de données)
  • Arnould, Frank (expert en terminologie du domaine)
  • Morale, Enza (expert en terminologie du domaine)
Date de créationdcterms:created
2015-01-15
Date de publication sur data.istex.frdcterms:issued
2018-12-12
Naviguer dans le contenu du corpus
Les graphiques ci-dessous permettent de visualiser la répartition des documents du corpus selon différents angles de vue bibliométriques et en fonction d'une analyse thématique réalisée avec Topic Modeling à des fins d'exploration du corpus.
Editeurs
Types de publication
Langue des documents
Types de documents
Catégories Science Metrix
Catégories Inist
Catégories Scopus
Catégorie Scopus - Niveau 1
Catégorie Scopus - Niveau 2
Catégorie Scopus - Niveau 3
Catégories WOS
Revues
Années de publication
Présence de XML structuré
Versions PDF
Scores de qualité
Analyse 10 thématiques Topic Modeling
Analyse 20 thématiques Topic Modeling
Powered by Lodex 9.3.8