dataset

Un dataset ou data-set est un ensemble de données (ou jeu de données). C’est une collection de données, généralement présentée sous forme de tableau. Au sens strict, un ensemble de données est une collection d’une ou plusieurs tables, schémas, points et/ou objets qui sont combinés soit parce qu’une ou plusieurs tables sont stockées au même endroit, soit parce qu’elles sont liées au même sujet. Un ensemble de données est une collection d’ensembles d’informations liés, composés d’éléments distincts, qui peuvent être traités par un ordinateur comme une seule unité. Dans une base de données, par exemple, un ensemble de données peut contenir une collection de données sur une entreprise (noms, salaires, coordonnées, chiffres de vente, etc.).

En statistique

En statistique, les ensembles de données proviennent généralement d’observations réelles faites à partir d’un échantillonnage d’une population statistique, chaque ligne correspondant à une observation sur un élément de cette population. Un ensemble de données peut être constitué de données sur un ou plusieurs membres, en fonction du nombre de lignes présentes.