s-207
| Deoarece seria de distribuție a mediilor eșantioanelor este aproape normală putem stabili legături probabiliste între media populației și media unui eșantion. |
s-208
| Considerăm o populație a cărei medie nu o cunoaștem și ne punem problema s-o găsim. |
s-209
| Pentru acest scop considerăm un eșantion aleator de dimensiune n pentru care determinăm media. |
s-210
| Media eșantionului este o estimare punctuală a mediei populației. |
s-211
| Un interval mărginit (a, b) folosit pentru a estima valoarea unui anumit parametru gamma al populației se numește interval de estimare. |
s-212
| Valorile a, b (capetele intervalului) sunt calculate din eșantionul care este folosit pentru estimare. |
s-213
| Nivelul de neîncredere alpha este probabilitatea ca statistica eșantionului să aibe valoarea în afara intervalului de estimare. |
s-214
| Un spațiu metric cu proprietatea că orice șir Cauchy este convergent este numit spațiu complet. |
s-215
| Nivelul de încredere (coeficient de încredere) 1 - alpha este probabilitatea ca statistica eșantionului să se afle în intervalul de estimare ales. |
s-216
| Intervalul de încredere este un interval de estimare cu un nivel de încredere 1 - alpha specificat. |
s-217
| Eroarea maximă de estimare este jumătatea lungimii intervalului de încredere cu nivelul de încredere 1 - alpha |
s-218
| Spațiile normate complete se numesc spații Banach iar spațiile prehilbertiene complete sunt numite spații Hilbert. |
s-219
| Într-un spațiu metric, orice șir Cauchy este mărginit. |
s-220
| Într-un spațiu Banach, o serie absolut convergentă este convergentă. |
s-221
| Formulele (28) au sens pentru orice funcție f integrabilă pe intervalul închis [- pi, pi] și permit asocierea de serii trigonometrice unei clase foarte largi de funcții. |
s-222
| Vom prezenta pe parcursul acestei secțiuni condiții suficiente pentru ca o astfel de serie să fie convergentă (punctual, uniform), condiții suficiente ca suma seriei să coincidă cu funcția f corespunzătoare, etc. |
s-223
| Posibilitatea reprezentării unei funcții ca sumă a unei serii trigonometrice sau posibilitatea aproximării ei (într-un anumit sens) cu polinoame trigonometrice este foarte utilă în multe aplicații. |
s-224
| Dacă se modifică valorile luate de o funcție continuă pe porțiuni într-un număr finit de puncte, funcția rezultată rămâne continuă pe porțiuni. |
s-225
| Mulțimea Q + a numerelor raționale pozitive este numărabilă. |
s-226
| Are sens să se pună problema dacă o funcție reală g este sau nu continuă pe porțiuni chiar dacă există un număr finit de puncte din domeniu în care ea nu este definită. |
s-227
| Fie f o funcție reală continuă pe porțiuni. |
s-228
| Dacă modificăm valorile pe care le ia f într-un număr finit de puncte din [- pi, pi] seria Fourier asociată nu se modifică. |
s-229
| Fără a restrânge generalitatea, vom considera doar funcții cu proprietatea f (- pi) = f (pi). |
s-230
| Orice astfel de funcție este restricția la [- pi, pi] a unei funcții periodice cu perioada 2pi (pentru care am păstrat aceeași notație). |
s-231
| Prin spațiu metric se înțelege orice mulțime nevidă pe care s-a definit o distanță, iar prin spațiu normat orice spațiu vectorial pe care s-a definit o normă. |
s-232
| Noțiunea de spațiu metric este mult mai generală decât cea de spațiu normat și în același timp cu o structură matematică mult mai săracă. |
s-233
| Elementele unui spațiu normat pot fi descrise prin utilizarea unei baze în spațiul vectorial corespunzător. |
s-234
| Noțiunea de spațiu metric fiind foarte generală, elementele pe care le implică sunt, în general, insuficiente pentru a permite descrierea unor sisteme fizice. |
s-235
| Spațiile metrice care intervin în modelele matematice utilizate în fizică sunt, în general, spații normate sau submulțimi ale unor spații normate. |
s-236
| Alegând pentru fiecare număr fracția ireductibilă corespunzătoare formăm un șir punând mai întâi fracțiile cu suma dintre numărător și numitor egală cu 1, apoi cele pentru care suma este 2, apoi cele pentru care suma este 3, etc. |
s-237
| În general, punctul de la care se pleacă în construcția unui model matematic este un spațiu normat. |
s-238
| Orice submulțime nevidă a unui spațiu normat are o structură naturală de spațiu metric. |
s-239
| În anumite aplicații este utilă cunoașterea comportării unei funcții f în vecinătatea unui punct a fără a lua în considerare valoarea pe care o ia funcția în punctul a (în cazul în care ea este definită în a). |
s-240
| În particular, este util să se știe ce se întâmplă cu valorile f (x) ale funcției când x se apropie din ce în ce mai mult de punctul a. |
s-241
| Pentru ca problema să aibă sens este necesar ca domeniul de definiție al lui f să conțină puncte oricât de apropiate de a, diferite de a. |
s-242
| Vom studia comportarea unei funcții în vecinătatea unui punct a aparținând domeniului de definiție comparând valoarea funcției în a cu valorile luate în vecinătatea lui a. |
s-243
| Punctele lui D care nu sunt puncte de acumulare se numesc puncte izolate. |
s-244
| Orice funcție derivabilă într-un punct este continuă în acel punct. |
s-245
| Statistica este știința colectării, clasificării, prezentării, interpretării datelor numerice și a folosirii acestora pentru a formula concluzii și a lua decizii. |
s-246
| Statistica și probabilitățile sunt două domenii strâns legate, dar distincte ale matematicii. |
s-247
| Rezultă imediat că mulțimea Q a tuturor numerelor raționale este și ea numărabilă. |
s-248
| Se spune că ” probabilitățile sunt vehiculul statisticii ”. |
s-249
| Aceasta este adevărat în sensul că dacă nu ar fi legile probabiliste teoria statistică nu ar fi posibilă. |
s-250
| Pentru a ilustra însă diferența dintre probabilități și statistică să considerăm două urne: una probabilistă și una statistică. |
s-251
| În cazul urnei probabiliste se știe că urna conține 5 bile albe, 5 bile negre și 5 bile roșii; |
s-252
| problema de probabilitate este dacă scoatem o bilă, care este șansa ca aceasta să fie albă? |
s-253
| În cazul unei urne statistice nu cunoaștem care este combinația de bile din urnă. |
s-254
| Extragem un eșantion și din acest eșantion conjecturăm ce credem că se găsește în urnă. |
s-255
| Populația este o colecție (mulțime) de indivizi, obiecte sau date numerice obținute prin măsurători ale cărei proprietăți trebuiesc analizate. |
s-256
| Eșantionul este o submulțime a unei populații. |
s-257
| O variabilă de răspuns (sau simplu variabilă) este o caracteristică (de obicei numerică) care prezintă interes în cazul fiecărui element (individ) al unei populații. |
s-258
| În secțiunea anterioară am prezentat noțiuni și rezultate referitoare la șiruri de elemente din R. |
s-259
| Parametru este o caracteristică numerică a unei populații. |
s-260
| O statistică este o caracteristică numerică a unui eșantion. |
s-261
| Un recensământ este o enumerare sau o listare a fiecărui element al populației împreună cu data (valoarea variabilei) corespunzătoare elementului. |
s-262
| Proiectarea eșantionului înseamnă stabilirea procedurii de alegere a elementelor eșantionului din cadrul eșantionului. |
s-263
| Eșantioane bazate pe reprezentativitate sunt acelea pentru care elementele se aleg astfel încât din perspectiva variabilei de răspuns, elementul ales să fie reprezentativ pentru populație. |
s-264
| Un eșantion de mărimea n este eșantion probabilist aleator dacă orice eșantion de mărimea n ales din același cadru are aceeași probabilitate să fie ales. |
s-265
| Un eșantion probabilist aleator pentru care elementele sunt selectate dintr-un cadru în care elementele au aceeași probabilitate să fie alese se numește eșantion aleator simplu. |
s-266
| Eșantionul sistematic se construiește alegând fiecare al k-lea element din cadrul eșantionului. |
s-267
| Un eșantion obținut în urma stratificării cadrului eșantionului și prin selectarea unui număr dat de elemente din fiecare strat se numește eșantion stratificat. |
s-268
| Eșantion cotă (sau eșantion proporțional) este un eșantion stratificat care se construiește prin selectarea unui număr de elemente din fiecare strat după o anumită cotă sau proporțional cu mărimea stratului. |
s-269
| Unele dintre aceste noțiuni pot fi extinse pentru a deveni aplicabile șirurilor de elemente din spații mult mai generale. |
s-270
| Frecvența f (din coloana a doua) arată de câte ori apare valoarea variabilei x în setul de date. |
s-271
| Seria de distribuție este un ansamblu de două șiruri finite dintre care primul este șirul elementelor distincte din setul de date statistice sau șirul claselor obținute prin gruparea elementelor din setul de date statistice, iar cel de-al doilea este șirul de frecvențe corespunzătoare. |
s-272
| Valoarea datei care apare cu cea mai mare frecvență într-o serie de distribuție de date statistice se numește mod. |
s-273
| Clasa cu cea mai mare frecvență într-o serie de distribuție de date grupate se numește clasă modală. |
s-274
| Seria bimodală este o serie de distribuție de date grupate în care apar două clase modale, separate de clase cu frecvență mai joasă. |
s-275
| Frecvența cumulată a unei clase este suma frecvențelor tuturor claselor cu valori mai mici (marca mai mică). |
s-276
| Tabelele statistice sunt foarte variate și se folosesc pentru ordonarea datelor statistice dintr-un set de date în vederea aplicării metodelor de calcul și de interpretare statistică. |
s-277
| Graficele de reprezentare a seriilor statistice fără grupare se numesc diagrame. |
s-278
| O histogramă are următoarele componente: |
s-279
| Un titlu care identifică populația la care se referă; |
s-280
| Noțiunile de șir convergent, șir mărginit și de șir Cauchy se definesc cu ajutorul funcției modul. |
s-281
| O scară orizontală pe care se identifică variabila X, valorile limitelor claselor, frontierele claselor, mărcile claselor. |
s-282
| O scară verticală pe care se identifică frecvențele pentru fiecare clasă. |
s-283
| Frecvența relativă (este o măsură proporțională cu frecvența în cauză) se obține prin împărțirea frecvenței clasei la numărul total de elemente din setul de date. |
s-284
| O categorie de caracteristici numerice asociate unui set de date statistice sunt: parametrii tendinței centrale în cazul populațiilor și statistici ale tendinței centrale în cazul eșantioanelor. |
s-285
| Întrucât aceștia au definiții analoage vom prezenta doar statistici ale tendinței centrale. |
s-286
| Media aritmetică m a setului de date statistice {x1, x2, ..., xn} este prin definiție suma acestor date împărțită la numărul datelor. |
s-287
| Parametrii și statisticile dispersiei sunt: plaja, deviația medie absolută, varianța, deviația standard și coeficientul de variație. |
s-288
| Aceste valori numerice descriu mărimea împrăștierii ori a variabilităților datelor. |
s-289
| Datele strâns grupate vor avea împrăștiere mică, iar cele care nu sunt grupate (sunt împrăștiate) vor avea o dispersie mai mare. |
s-290
| Este important de remarcat faptul că demonstrațiile rezultatelor prezentate nu se bazează direct pe definiția modulului. |
s-291
| Plaja P este diferența dintre cea mai mare (H) și cea mai mică (L) valoare a valorilor xi dintr-un set de date. |
s-292
| Deviația medie absolută, varianța și deviația standard măsoară dispersia față de media aritmetică. |
s-293
| Cu toate că acest parametru al împrăștierii nu se folosește frecvent, el este o măsură a împrăștierii și arată distanța medie la care se află o valoare a variabilei X față de media aritmetică. |
s-294
| Mai există o cale de eliminare a reducerii deviațiilor. |
s-295
| Ridicând la pătrat deviațiile individuale acestea devin pozitive (sau zero). |
s-296
| Când aceste pătrate sunt adunate rezultatul este pozitiv. |
s-297
| Deviația standard a fost definită cu o formulă. |
s-298
| Se poate pune întrebarea ce reprezintă ea în realitate? |
s-299
| Un răspuns la această întrebare poate fi dat cu inegalitatea lui Cebîșev din care rezultă că pentru orice serie de distribuție fracțiunea de date situată la cel mult k unități de deviație standard față de medie este cel puțin 1 - 1 / (k * k), unde k este un număr pozitiv oarecare mai mare ca 1. |
s-300
| Rezultă în particular că pentru orice serie de distribuție fracțiunea de date situată la cel mult k = 2 unități de deviație standard față de medie este de cel puțin 75% din totalul de date. |
s-301
| Afirmația rezultă din teorema precedentă ținând seama de faptul că șirurile de numere reale xn și yn sunt convergente dacă și numai dacă sunt șiruri Cauchy. |
s-302
| Dacă k = 3 atunci este 89% din totalul de date. |
s-303
| Conform regulii empirice dacă o serie de repartiție este normală atunci fracțiunea de date situate la cel mult o unitate de deviație standard s față de medie este aproximativ 68%, iar fracțiunea de date situate la cel mult două unități de deviație standard s față de medie este aproximativ 95%. |
s-304
| Coeficientul de variație V este prin definiție V = 100 * s / m; |
s-305
| Coeficientul de variație este o statistică relativă a dispersiei și se folosește la compararea dispersiei diferitelor variabile (caracteristici). |
s-306
| V poate lua valori între 0 și 100%. |