Mi az a hisztogram?

Mi az a hisztogram?

A hisztogram egy olyan típusú grafikon, amely széles körben alkalmazható a statisztikákban. A hisztogramok a numerikus adatok vizuális értelmezését biztosítják az értéktartományon belüli adatpontok számának feltüntetésével. Ezeket az értéktartományokat osztályoknak vagy gyűjtőhelyeknek nevezzük. Az egyes osztályokba tartozó adatok gyakoriságát egy oszlop használata ábrázolja. Minél nagyobb a sáv, annál gyakoribb az adatértékek ebben a tartályban.

Hisztogramok vs oszlopdiagramok

Első pillantásra a hisztogramok nagyon hasonlítanak az oszlopdiagramokra. Mindkét grafikon függőleges oszlopokat használ az adatok ábrázolására. A sáv magassága megfelel az osztályban szereplő adatmennyiség relatív gyakoriságának. Minél magasabb a sáv, annál nagyobb az adatok gyakorisága. Minél alacsonyabb a sáv, annál alacsonyabb az adatok gyakorisága. De a megjelenés megtévesztő lehet. Itt születnek a hasonlóságok a kétféle grafikon között.

Az ilyen típusú grafikonok eltérése az adatok mérési szintjével kapcsolatos. Egyrészt oszlopdiagramokat használnak az adatokhoz a névleges mérési szinten. Az oszlopdiagramok megmérik a kategorikus adatok gyakoriságát, és a oszlopdiagramok ezek a kategóriák. Másrészt, hisztogramokat kell használni olyan adatokhoz, amelyek legalább a mérés szokásos szintjén vannak. A hisztogram osztályai értéktartományok.

A sávdiagramok és a hisztogramok közötti másik fő különbség az oszlopok sorrendjével függ össze. Egy oszlopdiagramon a szokásos gyakorlat az oszlopok átrendezése csökkenő magasság szerint. A hisztogram sávjait azonban nem lehet átrendezni. Ezeket az osztályok sorrendjében kell megjeleníteni.

Példa egy hisztogramra

A fenti ábra hisztogramot mutat be. Tegyük fel, hogy négy érmét megfordítunk, és az eredményeket rögzítjük. A megfelelő binomiális eloszlási táblázat vagy egy egyszerű számítás használata a binomiális képlettel azt mutatja, hogy annak valószínűsége, hogy egyik fej sem jelenik meg, 1/16, annak valószínűsége, hogy az egyik fej megjelenik, 4/16. Két fej valószínűsége 6/16. Három fej valószínűsége 4/16. Négy fej valószínűsége 1/16.

Összesen öt osztályt építünk, amelyek mindegyike egy szélességű. Ezek az osztályok a lehetséges fejszámnak felelnek meg: nulla, egy, kettő, három vagy négy. Minden osztály fölé húzunk egy függőleges sávot vagy téglalapot. Ezeknek a rudaknak a magassága megfelel annak a valószínűségnek, amelyet a négy érme megfordítása és a fejek megszámlálása valószínűségi kísérletünk során említettünk.

Hisztogramok és valószínűségek

A fenti példa nemcsak a hisztogram felépítését szemlélteti, hanem azt is mutatja, hogy a hisztogrammal diszkrét valószínűség-eloszlások mutathatók be. Valójában, és a diszkrét valószínűség-eloszlást hisztogrammal reprezentálhatjuk.

Egy valószínűség-eloszlást ábrázoló hisztogram elkészítéséhez az osztályok kiválasztásával kezdjük. Ezeknek egy valószínűségi kísérlet eredményeinek kell lenniük. Ezen osztályok mindegyikének szélessége legyen egy egység. A hisztogram oszlopának magassága az egyes kimenetek valószínűsége. Az így felépített hisztogrammal a sávok területe szintén valószínűség.

Mivel az ilyen hisztogram valószínűségeket ad nekünk, néhány feltételnek van kitéve. Az egyik kikötés, hogy csak a nemnegatív számok használhatók arra a skálára, amely megadja nekünk a hisztogram adott oszlopának magasságát. A második feltétel az, hogy mivel a valószínűség megegyezik a területtel, a rudak összes területének összesen egynek kell lennie, amely 100% -nak felel meg.

Hisztogramok és egyéb alkalmazások

A hisztogram oszlopának nem kell valószínűségnek lennie. A hisztogramok a valószínűségtől eltérő területeken is hasznosak. Bármikor, amikor összehasonlítani kívánjuk a kvantitatív adatok előfordulásának gyakoriságát, egy hisztogram felhasználható az adatkészlet ábrázolására.