Új hozzászólás Aktív témák

  • Abu85

    HÁZIGAZDA

    válasz Busterftw #50562 üzenetére

    Továbbra sem az a gond, hogy nem pontos, mert egyik statisztika sem az. Az a gond, hogy nem írja le a Steam a módszertant. Ha leírnák, hogy miképpen történik az adatok feldolgozása, hogyan illesztik rá a mintavételt a teljes felhasználóbázisra, milyen súlyozási eljárásokat alkalmaznak, mekkora a minta elemszáma és annak hibahatára, valamint milyen gyakorisággal és milyen szűrések után frissülnek az adatok, akkor az egy reális statisztika lenne.

    Azt nem értik meg itt sokan, hogy itt a pontosság maga a módszertanból jön. Aki elmegy mondjuk az egyetemre statisztikát tanulni, az első dolog, amit megtanítanak vele, hogy egy mérés nem attól válik értelmezhetővé, hogy "nagy számok" vannak benne, hanem attól, hogy világosan le van írva a mintavétel módja, a torzítások forrása, illetve az alkalmazott becslés bizonytalansága. Ezek nélkül ugyanis nem dönthető el, hogy az adott statisztika reprezentatív becslés-e a teljes felhasználóbázisra, vagy csak egy önszelekcióval terhelt használhatatlan adathalmaz.

    Amikor mi tanultuk ezt, akkor a tanár úgy fogalmazott, hogy ha a módszertan nem transzparens, akkor az adatok nem hibásak, csak nem verifikálhatók. Ezt arra a szabályra építette, hogy minden publikált mutatót csak a mögötte meghúzódó adatgeneráló munkafolyamat teljes ismeretében lehet értelmezni.

    Jelen esetben nem az van, hogy elszart valamit megint a Steam Survey, hanem annyi történt, hogy azt se tudják egy ideje, hogy mit közölnek, ezért nem is látják, hogy hol vannak benne a torzítások. És ennek az oka, hogy nekik sincs erre semmilyen módszertanuk, ami a beáramló adatokat rendszerezné. És ez a gond, mert így a Steam annyit tud tenni, hogy széttárja a kezét, és azt mondják, hogy halvány fogalmunk sincs róla, hogy mennyi az annyi, de majd januárban rakunk arra az adatmezőre egy korlátot, hogy az összesítés ne lépje túl a 100%-ot. És ezért nem publikálnak módszertant. Nincs is nekik. Valószínűleg tele van konstansokkal szorozva az egész adathalmaz, mert már rég betorzította úgy önmagát, hogy 150-200%-okat közölhet minden kategóriában.

Új hozzászólás Aktív témák