Dina statistik, komposisi data nyaéta data dina unggal data point mangrupa n-tuple tina wilangan nonnegative nu jumlahna sarua jeung 1. Sacara tipikal unggal komponen n tina unggal titik data pi (p1, ..., pn) ngagambarkeun yén porsi (atawa "persentase") satuan statistik kana kategori nu ka-i dina urutan kategori n.

Contona,

  • Unggal titik data pakait kana susunan batuan disusun ku tilu mineral nu béda; batuan mibanda 10% mineral kahiji, 30% nu kadua, sarta sesana 60% nu pakait jeung triple (0.1, 0.3, 0.6); susunan data kudu mibanda hiji tina triple keur unggal batuan dina sampel batuan.
  • Unggal titik data nu pakait kana hiji kota; hiji kota nu mana 35% ngagem agama Kristen, 55% Muslim, 6% Yahudi, sarta sesana 4% ageman séjén, tangtu pakait jeung quadruple (0.35, 0.55, 0.06, 0.04); susunan data bakal pakait jeung ugeran dina éta kota.