Rozdělení pořadí. Mezinárodní studentský vědecký zpravodaj Hodnocení hodnocení jako výzkumná metoda

První věc, která přitahuje pozornost v oblasti dokumentů, je extrémně rychlý růst její populace.

Tato známá skutečnost nás nutí vážně se zamyslet nad tím, k čemu takový růst může vést. Možná jsou ale naše obavy marné a v budoucnu se tempo růstu počtu dokumentů zpomalí? Statistiky zatím ukazují opak.

Takto se změnily například dokumentární informační toky v chemii. V roce 1732 bylo celé dědictví chemie shrnuto a publikováno holandským profesorem v knize o 1433 stranách. V roce 1825 vydal švédský vědec Berzelius vše, co bylo v chemii známo, v 8 svazcích o celkovém objemu 4150 stran. V současné době americký abstraktový časopis Chemical Abstracts, vydávaný od roku 1907, publikuje téměř všechny informace o chemii, přičemž první milion abstraktů byl publikován 31 let po svém založení, druhý po 18 letech, třetí po 7 letech a čtvrtý – za 4 roky. !

Přibližně stejný vzorec růstu počtu dokumentů lze vysledovat i v jiných oblastech vědy. Bylo pozorováno, že růst dokumentů je exponenciální. Zároveň každoroční nárůst průtoků vědecké a technické informace je 7...10 %. V současné době se každých 10...15 let zdvojnásobí objem vědeckých a technických informací (STI) Křivka růstu počtu dokumentů tedy může být popsána exponentem formuláře

y = Ae kt

Kde y– souhrn znalostí zděděných od předchozích generací, E– základ přirozených logaritmů ( E = 2,718...), t– časový index (g); A– součet znalostí na začátku odpočítávání (s t = 0), K– koeficient charakterizující rychlost poznání, jehož ekvivalentem jsou toky vědeckých a technických informací. Na t≈ 10...15 let na = 2A.

Je snadné si představit, že tento typ růstu počtu vědeckých dokumentů pro nás nevěstí nic dobrého ani do budoucna, ani té blízké. Lesy se proměnily v hory papíru, ve kterých se topí bezmocný badatel...

Jak však ukazuje historie vědy a techniky, podmínky, ve kterých se vyvíjejí, nejsou konstantní, a proto je mechanismus exponenciálního růstu toků STI často narušen. Toto porušení je vysvětleno řadou omezujících faktorů, zejména válkami, nedostatkem materiálu a lidské zdroje atd. Ve skutečnosti se tedy nárůst počtu dokumentů nepodřizuje exponenciální závislosti, i když se v určitých obdobích rozvoje vědy a techniky v určitých oblastech poznání projevuje zcela zřetelně. Jaký je důvod tak rychlého nárůstu toku dokumentárních informací?



V předchozích částech jsme upozorňovali na to, že informace hrají ve vývoji obrovskou roli lidská společnost, proto je doprovázena zrychleným růstem objemu informací. Výška dokumentární streamy vědecké informace mohou být spojeny s nárůstem počtu tvůrců vědeckých informací. Rychlost tohoto růstu je popsána exponenciální funkcí. Například za posledních 50 let se počet vědců v SSSR zdvojnásobil každých 7 let, v USA - každých 10 let, v evropských zemích - každých 10...15 let.

Samozřejmě, že tempo růstu počtu vědeckých pracovníků se musí zpomalit a dosáhnout nějaké víceméně konstantní hodnoty ve vztahu k celé pracující populaci. Jinak bude po nějaké době celá populace zaměstnána výzkumnou a vývojovou prací, což je nereálné. Do budoucna bychom proto měli očekávat zpomalení tempa růstu vědeckých dokumentů. V současnosti jsou tyto sazby stále vysoké a znepokojují spotřebitele informací: jak uchovávat a zpracovávat dokumenty, jak mezi nimi najít ten, který potřebují?

Situace se zdá beznadějná: zákon o exponenciálním růstu dokumentů, který je stále platný v království dokumentů, v něm prudce zhoršil jak problémy s „bydlením“, tak s „dopravou“.

Jak se však ukazuje, existuje zde zákon, který současnou situaci poněkud zmírňuje...

Na konci 40. let našeho století se J. Zipf po shromáždění obrovského statistického materiálu pokusil ukázat, že distribuce slov v přirozeném jazyce se řídí jedním jednoduchým zákonem, který lze formulovat následujícím způsobem. Pokud vytvoříte seznam všech slov nalezených v dostatečně velkém textu, seřaďte tato slova sestupně podle četnosti jejich výskytu v tomto textu a očíslujte je v pořadí od 1 (pořadové číslo nejčastěji se vyskytujícího slova) do R, pak pro libovolné slovo bude součin jeho pořadového čísla (hodnosti) / v takovém seznamu a četnosti jeho výskytu v textu konstantní hodnotou, mající přibližně stejnou hodnotu pro libovolné slovo z tohoto seznamu. Analyticky lze Zipfův zákon vyjádřit jako



fr = C,

Kde F– četnost výskytu slova v textu;
r– pořadí (řadové číslo) slova v seznamu;
S– empirická konstantní hodnota.

Výsledná závislost je graficky vyjádřena hyperbolou. Poté, co jsme prozkoumali širokou škálu textů a jazyků,

včetně jazyků starých tisíce let zkonstruoval J. Zipf naznačené závislosti pro každý z nich, přičemž všechny křivky měly stejný tvar – tvar „hyperbolického schodiště“, tzn. při nahrazení jednoho textu jiným obecný charakter distribuce se nezměnila.

Zipfův zákon byl objeven experimentálně. Později B. Mandelbrot navrhl její teoretické zdůvodnění. Věřil, že psaný jazyk lze přirovnat ke kódování, přičemž všechny znaky mají určitou „hodnotu“. Na základě požadavků na minimální cenu zpráv dospěl B. Mandelbrot matematicky ke vztahu podobnému Zipfově zákonu

fr γ = C ,

kde γ je hodnota (blízká jednotě), která se může lišit v závislosti na vlastnostech textu.

J. Zipf a další badatelé zjistili, že takovému rozdělení podléhají nejen všechny přirozené jazyky světa, ale také další jevy sociální a biologické povahy: rozdělení vědců podle počtu článků, které publikovali (A. Lotka, 1926), města USA podle počtu obyvatel (J. Zipf, 1949), obyvatelstvo podle příjmu v kapitalistických zemích (V. Pareto, 1897), biologické rody podle počtu druhů (J. Willis, 1922) atd.

Nejdůležitější pro problém, který zvažujeme, je skutečnost, že podle tohoto zákona lze šířit dokumenty v jakémkoli oboru vědění. Zvláštním případem je Bradfordův zákon, který přímo nesouvisí s distribucí slov v textu, ale s distribucí dokumentů v rámci určitého tematického okruhu.

Anglický chemik a bibliograf S. Bradford, zkoumající články o aplikované geofyzice a mazání, si všiml, že distribuce vědeckých časopisů obsahujících články o mazání a časopisů obsahujících články o aplikované geofyzice obecná forma. Na základě zjištěné skutečnosti S. Bradford formuloval vzorec distribuce publikací mezi publikacemi.

Hlavní význam vzoru je následující: jestliže vědeckých časopisech seřadit v sestupném pořadí podle počtu článků podle konkrétní problém, pak lze časopisy ve výsledném seznamu rozdělit do tří zón tak, aby počet článků v každé zóně na dané téma byl stejný. Přitom první zóna, tzv. core zóna, zahrnuje specializované časopisy přímo věnující se zvažovanému tématu. Počet specializovaných časopisů v základní oblasti je malý. Druhou zónu tvoří časopisy věnující se částečně dané oblasti a jejich počet výrazně narůstá oproti počtu časopisů v jádru. Třetí zóna, co do počtu publikací největší, sdružuje časopisy, jejichž témata jsou velmi vzdálená zvažovanému tématu.

Při stejném počtu publikací na určité téma v každé zóně se tedy počet titulů časopisů při přechodu z jedné zóny do druhé prudce zvyšuje. S. Bradford zjistil, že počet časopisů ve třetí zóně bude přibližně tolikrát, kolikrát je počet titulů ve druhé zóně než v první. Označme R 1 – počet zásobníků v 1. zóně, R 2 – ve 2. R 3 – počet zásobníků ve 3. zóně.

Li A– poměr počtu zásobníků v 2. zóně k počtu zásobníků v 1. zóně, pak vzor objevený S. Bradfordem lze zapsat takto:

P 1: P 2: P 3 = 1: A : A 2

P 3: P 2 = P 2: P 1 = A.

Tento vztah se nazývá Bradfordův zákon.

B. Vickery zdokonalil model S. Bradforda. Zjistil, že časopisy řazené (řazené) v sestupném pořadí článků o určité problematice lze rozdělit nikoli do tří zón, ale do libovolného počtu zón. Pokud jsou periodika řazena podle klesajícího počtu článků o konkrétním čísle, pak lze ve výsledném seznamu rozlišit řadu zón, z nichž každá obsahuje stejný počet článků. Přijímáme následující zápis X– počet článků v každé zóně. T x– počet časopisů obsahujících Xčlánky, T 2X– počet protokolů obsahujících 2 Xčlánky, tzn. součet titulů časopisů v 1. a 2. zóně, T 3X– počet protokolů obsahujících 3 Xčlánky, tzn. součet titulů časopisů v 1., 2. a 3. zóně, T 4X– počet protokolů obsahujících 4 Xčlánky.

Pak bude tento vzor vypadat

T x : T 2X : T 3X : T 4X : ... = 1: A : A 2: A 3: ...

Tento výraz se nazývá Bradfordův zákon, jak jej vyložil B. Vickery.

Jestliže Zipfův zákon charakterizuje mnoho jevů sociální a biologické povahy, pak je Bradfordův zákon specifickým případem Zipfova rozdělení pro systém periodik o vědě a technice.

Z těchto vzorů lze vyvodit závěry s obrovským praktickým přínosem.

Pokud tedy seřadíte nějaká periodika v sestupném pořadí podle počtu článků v určitém profilu, pak je lze podle Bradforda rozdělit do tří skupin obsahujících stejný počet článků. Vyberme skupinu 8 titulů časopisů, které ve výsledném seznamu zaujímají prvních 8 míst. Poté, abychom zdvojnásobili počet článků na profilu, o které máme zájem, budeme muset ke stávajícím 8 přidat dalších 8 A tituly časopisů. Li A= 5 (tato hodnota byla u některých tematických okruhů zjištěna experimentálně), pak je počet těchto titulů 40. Celkový počet titulů periodik pak bude 48, což je samozřejmě výrazně více než 8. Pokud se pokusíme získat třikrát tolik článků, budeme muset pokrýt již 8 + 5 · 8 + 5 2 · 8 = 256 položek! Z toho třetina článků, které nás zajímají, je soustředěna pouze v 8 časopisech, tzn. Články jsou mezi názvy časopisů rozmístěny nerovnoměrně. Na jedné straně dochází ke koncentraci značného počtu článků na určité téma ve více odborných časopisech, na straně druhé dochází k rozptylu těchto článků v obrovské číslo publikace o příbuzných či vzdálených tématech z uvažovaného tématu, přičemž v praxi je nutné identifikovat hlavní zdroje z oblasti vědeckých a technických poznatků, které nás zajímají, a nikoli náhodné publikace.

Vzorce koncentrace a rozptylu vědeckých a technických informací v oblasti dokumentů umožňují vybrat právě ty publikace, které s největší pravděpodobností obsahují publikace, které odpovídají určitému profilu znalostí. V hromadném procesu informační podpora V národním měřítku použití těchto zákonů umožňuje snížit obrovské náklady pro národní hospodářství.

Současný rozptyl publikací nelze hodnotit pouze jako škodlivý jev. V rozptýleném prostředí se zlepšují příležitosti pro výměnu informací napříč odvětvími.

Pokus o soustředění všech publikací jednoho profilu do více časopisů, tzn. zabránění jejich rozptýlení bude mít negativní důsledky, nemluvě o tom, že přesné přiřazení dokumentu k jednomu nebo druhému profilu není vždy možné.

Výsledky testů Bradfordova disperzního zákona, jak ukázal S. Brooks, mají různou míru shody. I přes provedené změny Bradfordův model neodráží rozmanitost skutečných distribucí. Tento rozpor lze vysvětlit tím, že Bradford učinil své závěry na základě výběru polí vztahujících se pouze k úzkým tematickým oblastem.

Velkou zásluhou J. Zipfa a S. Bradforda je, že iniciovali rigorózní studium dokumentárních informačních toků (DIF), což jsou sbírky vědeckých dokumentů, publikací a nepublikovaných materiálů (například zprávy o výzkumných a vývojových pracích). Další výzkum, mezi nimiž přední místo zaujímá práce sovětského specialisty v oblasti informatiky V.I. Gorkova, ukázal, že je možné stanovit nejen kvantitativní parametry souborů vědeckých dokumentů, ale také soubory prvků atributů vědeckých dokumentů: autory, termíny, indexy klasifikačních systémů, názvy publikací, tzn. názvy prvků charakterizujících obsah vědeckých dokumentů. Můžete například uspořádat časopisy v sestupném pořadí podle počtu autorů v nich publikovaných, v sestupném pořadí podle průměrné velikosti článků v nich publikovaných nebo seřadit sbírku dokumentů podle kteréhokoli z jejích prvků.

Pořadí je určeno pořadím (pořadí umístění) názvů prvků podle četnosti jejich výskytu v sestupném pořadí. Taková uspořádaná sada názvů prvků se nazývá rozdělení pořadí. Distribuce, které Zipf kdysi studoval, jsou typické příklady rozdělení pořadí. Ukázalo se, že typ hodnostního rozložení a jeho struktura charakterizuje množinu dokumentů, ke kterým dané hodnostní rozložení náleží. Ukázalo se, že při konstrukci mají rozdělení pořadí ve většině případů podobu Zipfova zákona s Mandelbrotovou korekcí:

fr γ = C.

V tomto případě je koeficient γ proměnnou hodnotou. Konstanta koeficientu γ je zachována pouze ve střední části grafu rozdělení. Tato část má podobu přímky, pokud je graf výše uvedeného vzoru vykreslen v logaritmických souřadnicích. Rozvodný úsek s γ = konst se nazývá centrální zóna rozdělení pořadí (hodnota argumentu v této oblasti se liší od Inr 1, až Inr 2). Hodnoty argumentu od 0 do Inr 1 odpovídá zóně jádra distribuce pořadí a hodnotám argumentů z Inr 2 až Inr 3 – tzv. zóna zkrácení.

Jaký význam má existence tří jasně rozlišitelných zón rozdělení pořadí? Pokud ten druhý odkazuje na termíny, které tvoří jakoukoli oblast vědění, pak jaderná zóna nebo zóna jádra hodnostního rozdělení obsahuje nejběžněji používané obecné vědecké termíny. Centrální zóna obsahuje pojmy, které jsou nejcharakterističtější pro danou oblast vědění, které společně vyjadřují její specifičnost, odlišnost od jiných věd a „zahrnují její hlavní obsah“. Zóna zkrácení obsahuje termíny, které se v této oblasti znalostí používají poměrně zřídka.

Základ slovní zásoby jakéhokoli oboru vědění je tedy soustředěn v centrální zóně rozdělení pořadí. Při použití termínů jaderné zóny se tato oblast znalostí „spojuje s obecnějšími oblastmi znalostí“ a zóna zkrácení hraje roli avantgardy, jako by „tápala“ po spojení s jinými odvětvími vědy. Pokud by se tedy ještě před pár lety v žebříčkové distribuci pojmů v tematické oblasti „Zpracování kovů“ našel pojem „lasery“, pak by díky svému nízkému výskytu zcela jistě spadal do zóny zkrácení: souvislosti mezi laserová technologie a zpracování kovů se teprve „prohmatávaly““ Dnes by však tento pojem nepochybně spadal do centrální zóny, což by odráželo jeho poměrně vysoký výskyt a tedy stabilní spojení laserové technologie se zpracováním kovů.

Graf rozdělení pořadí je plný hluboký význam: po všem relativní velikost určité zóny v grafu lze použít k posouzení charakteristik celé oblasti znalostí. Graf s velkou jádrovou zónou a malou zkrácenou zónou patří do poměrně široké a pravděpodobně konzervativní oblasti znalostí. Dynamická vědní odvětví se vyznačují zvýšenou zónou zkrácení. Malá velikost jaderné zóny může ukazovat na originalitu oboru vědění, do kterého konstruovaná hodnostní distribuce patří atd. Na základě analýzy rozdělení pořadí se tedy ukázalo, že je možné kvalitativně hodnotit toky dokumentárních informací v souladu s vědními obory, kde byly vytvořeny. Království dokumentů nabývá podoby systému, ve kterém jsou prvky vzájemně propojeny, a vzory, jimiž se tato spojení řídí, lze studovat!

Jak informace stárnou...

Stárnutí... Význam tohoto pojmu nevyžaduje vysvětlení, je všem dobře znám. Naše planeta stárne a stromy stárnou. Věci a lidé, kteří je vlastní, stárnou. Dokumenty také stárnou. Stránky knihy žloutnou, písmena blednou, obálky jsou zničené. Ale co to je? Student odmítne knihu, která mu byla nabídnuta v knihovně, a pohrdavě poznamená: „Už je zastaralá!“, ačkoli kniha stále vypadá úplně nová! Samozřejmě zde není žádné tajemství. Kniha je nová, ale informace v ní mohou být zastaralé. Stárnutí není ve vztahu k dokumentům chápáno jako fyzické stárnutí nosiče informace, ale jako poměrně složitý proces stárnutí informací v něm obsažených. Navenek se tento proces projevuje ztrátou zájmu vědců a specialistů o publikace s tím, jak se prodlužuje doba, která od jejich vydání uplynula. Jak ukázal průzkum mezi 17 knihovnami, který provedl jeden z oborových informačních orgánů, 62 % návštěv se týkalo časopisů mladších 1,5 roku; 31 % požadavků je na časopisy staré 1,5...5 let; 6 % – pro časopisy ve věku od 6 do 10 let; 7 % – pro časopisy starší 10 let. Publikace vydané relativně dávno jsou konzultovány mnohem méně často, což vede k tvrzení, že jsou zastaralé. Jaké mechanismy řídí proces stárnutí dokumentů?

Jeden z nich přímo souvisí s kumulací, agregací vědeckých informací. Materiál, který před sto lety vyžadoval celý kurz přednášek, lze dnes často vysvětlit během několika minut pomocí dvou nebo tří vzorců. Odpovídající přednáškové kurzy jsou beznadějně zastaralé: už je nikdo nepoužívá.

Jakmile jsou získány přesnější, přibližné údaje, a tedy i dokumenty, ve kterých jsou publikovány, zastarávají. Hovoří-li se tedy o stárnutí vědeckých informací, mají na mysli nejčastěji jejich objasňování, důslednější, stručnější a zobecněnější prezentaci v procesu tvorby nových vědeckých informací. To je možné díky tomu, že vědecké informace mají vlastnost kumulativnosti, tzn. umožňuje stručnější, obecnější prezentaci.

Někdy má stárnutí dokumentárních informací jiný mechanismus: objekt, jehož popis máme, se v průběhu času mění natolik, že se informace o něm stávají nepřesnými. Tak stárnou geografické mapy: pouště jsou nahrazeny pastvinami, objevují se nová města a moře.

Na proces stárnutí lze také pohlížet jako na ztrátu informací praktické užitečnosti pro spotřebitele. To znamená, že jej již nemůže použít k dosažení svých cílů.

A konečně, tento proces lze posuzovat z hlediska změn v tezauru člověka. Z těchto pozic mohou být stejné informace pro jednu osobu „zastaralé“ a pro jinou „neaktuální“.

Stupeň stárnutí dokumentární informace není stejný pro odlišné typy dokumenty. Rychlost jeho stárnutí je v různé míře ovlivněna mnoha faktory. Rysy informačního stárnutí v každé oblasti vědy a techniky nelze odvodit na základě abstraktních úvah nebo průměrných statistických údajů - organicky souvisí s vývojovými trendy každého samostatné odvětví věda a technika.

Aby bylo možné nějak kvantifikovat rychlost stárnutí informací, knihovník R. Barton a fyzik R. Kebler z USA, analogicky s poločasem rozpadu radioaktivních látek, zavedli „poločasy“ vědeckých článků. Poločas rozpadu je doba, během níž byla publikována polovina veškeré v současnosti používané literatury o jakémkoli oboru nebo tématu. Je-li poločas rozpadu publikací ve fyzice 4,6 roku, pak to znamená, že 50 % všech aktuálně používaných (citovaných) publikací v této oblasti není starších než 4,6 roku. Zde jsou výsledky získané Bartonem a Keblerem: za publikace ve fyzice - 4,6 roku, fyziologii - 7,2, chemii - 8,1, botanice - 10,0, matematice - 10,5, geologii - 11,8 roku. Ačkoli je vlastnost informačního stárnutí objektivní povahy, neodhaluje vnitřní proces vývoje dané oblasti znalostí a je spíše popisná. Proto je třeba se závěry o stárnutí informací zacházet velmi opatrně.

Nicméně i hrubý odhad rychlosti stárnutí informací a dokumentů, které je obsahují, má obrovskou praktickou hodnotu: pomáhá mít na očích pouze tu část říše dokumentů, ve které se s největší pravděpodobností nacházejí dokumenty obsahující základní informace o daném Věda. To je důležité nejen pro zaměstnance vědeckých a technických knihoven a vědeckotechnických informačních orgánů, ale i pro samotné spotřebitele NTI.

Řešení automatizace?

Pro modelování struktury spotřeby energie podniku se používají řadová rozdělení a pro modelování struktury instalovaných a opravovaných elektrických zařízení typová rozdělení.


Rozdělení pořadí. Pořadové rozvody zahrnují takové rozvody, u nichž je hlavním znakem elektrická kapacita všech typů výrobků.

Rozdělením elektrických kapacit všech typů výrobků vyrobených v jednom konkrétním podniku se rozumí rozdělení pořadí. Parametr rozdělení pořadí je koeficient pořadí. Můžete získat křivky rozdělení pořadí a určit koeficienty pořadí pro vykazovaná období (podle čtvrtletí, pololetí nebo roku). Pokud koeficient řazení zůstává v čase konstantní, znamená to, že se struktura produktů a struktura spotřeby elektřiny v čase nemění. Zvýšení koeficientu pořadí ukazuje, že podnik v průběhu let zvýšil rozmanitost produktů a rozdíl v nákladech na energii na výrobu různých typů.

Pokud pro každý typ produktu víceproduktové výroby počítáme elektrickou kapacitu jako poměr roční spotřeby elektřiny k objemu produkce tohoto typu, pak pro podnik jako celek tyto hodnoty podléhají pořadí rozdělení. . Získané parametry pořadí pořadí v průběhu let mají vcelku stabilní tendenci se zvyšovat. Nárůst koeficientu pořadí ukazuje, že rozmanitost produktů vyráběných v podniku a rozdíl v nákladech na energii na výrobu různých typů se v průběhu let zvyšují.

Sada křivek rozložení pořadí představuje plochu. Analýza strukturní a topologické dynamiky (trajektorie pohybu jedince po křivce řadového rozdělení) na tomto povrchu poskytuje časovou řadu elektrické kapacity každého typu studovaného produktu, která je zajímavá z hlediska možnosti předpovídání parametrů spotřeby energie. Můžeme dojít k závěru, že existuje silná korelace mezi roční spotřebou energie víceproduktové výroby, strukturou vyráběných produktů a rozmanitostí vyráběných produktů.

Struktura instalovaných a opravovaných zařízení. Pořadové a druhové rozšíření

Které distribuce jsou klasifikovány jako pořadí

Možnost 2 (s více než 20 možnostmi). V první fázi respondent rozdělí navržené možnosti do dvou nebo tří skupin: 1 - vhodné, 2 - nevhodné, třetí skupinu mohou tvořit možnosti, které respondent obtížně zařazuje do jiných skupin. Pokud při prvním rozdělení zůstane ve skupině více než 10-12 pozic, které jsou vhodné, pak je respondent požádán, aby tuto skupinu opět rozdělil podle principu přesně vhodné - případně vhodné. Po identifikaci vhodných možností musí respondent provést přímé hodnocení a seřadit možnosti od nejlepší po nejhorší. V souladu s výsledky výběru jsou každému respondentovi přiřazeny hodnoty pořadí, nejlépe v opačném pořadí (nejlepší hodnota je 10, další je 9, nejhorší je 1; při více než 10 volbách se přiřadí všechny poslední volby hodnotu 1.

Jak již bylo zmíněno, ukazatele pořadí se používají k charakterizaci tvaru rozložení variační řady. Máme tím na mysli takové jednotky zkoumaného pole, které zaujímají určité místo ve variační řadě (například desátá, dvacátá atd.). Říká se jim kvantily nebo gradienty. Kvantily jsou zase rozděleny

Proč Dunnova statistika pořadí (dt) pro testování kontrastů (viz rovnice (41)) vyžaduje tabulky normálního rozdělení spíše než -test

Neparametrické metody. Neparametrické statistické metody, na rozdíl od parametrických, nejsou založeny na žádných předpokladech o zákonech rozdělení dat3. Spearmanův koeficient pořadové korelace a Kendallův koeficient pořadové korelace se často používají jako neparametrická kritéria pro vztah proměnných.

Histogram je grafické znázornění statistických rozdělení libovolné veličiny podle kvantitativní charakteristiky. Je vhodné sestrojit histogram (gr. histos - tkanina) shora, vynést odpovídající faktory podél osy x a jejich součty pořadí podél osy pořadnice. Histogram může vykazovat poklesy, podle kterých je vhodné seskupovat faktory podle míry jejich vlivu na sledovaný ukazatel.

Prezentované cenologické myšlenky lze použít jako základ pro změnu organizace systému 111 IF v průmyslovém podniku (na dílně). V tomto případě se nepoužívá typové rozdělení instalovaných elektrických zařízení, ale znázornění celého seznamu např. elektrických strojů v podobě H-rozdělení seřazené podle parametru. To se provádí následovně. Celý soubor instalovaných strojů je řazen podle významu (důležitosti) v technickém nebo jiném procesu. Každému vozidlu je přidělena vlastní hodnost (číslo). První pořadí je přiřazeno stroji, který nejvíce určuje výrobní proces. Druhý je pro další nejdůležitější stroj atd., takže na posledním místě přijdou stroje, jejichž porucha neovlivňuje, nebo spíše velmi málo ovlivňuje výrobu a další činnosti podniku. Operace přiřazení hodnosti nevyžaduje zvláštní přesnost, takže daný stroj může skončit na trochu jiném místě v daném rank listu.

Využijme skutečnosti x2 (12)-distribuce náhodné veličiny m (n - 1) W (m), která se vyskytuje přibližně v případě, kdy ve zkoumané populaci neexistuje vícenásobný rank vztah. Poté se kritérium redukuje na kontrolu nerovnosti (2.18). Po nastavení hladiny významnosti kritéria a = 0,05 zjistíme z tabulky. A.4 hodnota 5% bodu rozdělení x2 s 12 stupni volnosti X OB (12) = 21,026. Současně t (n - I) W (t) = - 28-12-0,08 - 27.

Nejprve si znovu povšimněte, že rozdělení frekvencí je vždy symetrické. Tabulková data 6.9 ukazují, že v souladu s tím symetrie frekvencí odráží symetrii kvantitativního stanovení koeficientu pořadové korelace na základě Kinv inverzí. Spearmanův (p) a Kendallův (T) korelační koeficient. Tyto metody jsou použitelné nejen pro kvalitativní, ale i pro kvantitativní ukazatele, zejména s malou velikostí populace, protože neparametrické metody korelace pořadí nejsou spojeny s žádnými omezeními ohledně charakteru rozložení charakteristiky.

Po získání posloupnosti rozdělení ft(P) vyvstává úkol studovat proces přechodu mezi nimi, tzn. mobilita regionů podle cen. Jak je uvedeno v přehledu Fields, Ok (2001), samotný koncept mobility není jasně definován, literatura o mobilitě neposkytuje jednotný popis analýzy (a neexistuje žádná zavedená terminologie). V ekonomické a sociologické literatuře však panuje shoda ohledně dvou hlavních koncepcí mobility. Prvním je relativní (neboli hodnostní) mobilita spojená se změnami v řazení, v našem případě, regionů podle cenové hladiny. Druhým pojmem je absolutní (resp. kvantitativní) mobilita, spojená se změnami samotných cenových hladin v regionech. V následující analýze jsou použity oba tyto koncepty.

Jiné postupy. Uvažujeme proceduru založenou na Steeleově hodnostní statistice pro srovnání experimentálních a kontrolních prostředků, o kterých jsme hovořili dříve. Tento alternativní postup také předpokládá stochasticky uspořádaná rozdělení. Pro tuto třídu distribucí je postup méně efektivní liší se pouze posunem (viz

Holeova metoda sekvenčního pořadí s eliminací pro stochasticky uspořádaná rozdělení. Stochasticky uspořádaná rozdělení pokrývají rozdělení, která se liší pouze posunem, ale ne normální rozdělení s různými rozptyly. Nevíme, zda je metoda citlivá na odchylky od předpokladu stochastického řádu.

Plánování a provádění experimentů k určení parametrů síťových útoků

V další fázi kontroly dopravního modelu je nutné zjistit, zda lze tento model aplikovat na úkoly zabezpečení sítě, zejména na detekci síťových útoků.

Aby bylo možné zjistit podrobnosti o neoprávněném vniknutí, bylo rozhodnuto provést experimenty simulující pokusy o útok. Byly provedeny na síti Samarské státní letecké univerzity (SSAU).

Jako zdroj útoku byla použita vzdálená data. osobní počítače, připojený k internetu, umístěný v externí síti ve vztahu ke zkoumané síti. Cílem útoku byl jeden z interních serverů sítě SSAU. Jako NetFlow senzor byl vybrán hraniční router sítě SSAU Cisco 6509 a NetFlow kolektor byl stejný server, který byl napaden.

Do skenování byl zapojen pouze jeden počítač, protože útok skenování portů je prováděn z jednoho zdroje. Ke skenování byl použit program Nmap, který dostal pokyn provést úplnou kontrolu všech portů napadeného serveru.

Nmap je bezplatný nástroj určený pro různé zakázkové skenování IP sítí s libovolným počtem objektů, zjišťování stavu objektů skenované sítě (portů a jim odpovídajících služeb). Nmap používá mnoho různé metody skeny jako UDP, TCP (připojení), TCP SYN (polootevřené), FTP proxy (prolomení ftp), Reverse-ident, ICMP (ping), FIN, ACK, Xmas tree, SYN a NULL scan.

Při provádění DDoS útoku byl jako cíl útoku zvolen stejný webový server jako při skenování. Zdrojem útoku bylo několik počítačů umístěných v externí síti. V první části experimentu útočící počítače současně půl hodiny posílaly požadavky na ping a prováděly ICMP záplavový útok. V druhé části experimentu provedly útočící počítače DDoS útok pomocí specializovaného programu LOIC. Během hodiny byl webový server napaden pomocí různé typy provoz: HTTP, UDP, TCP. Během všech experimentů byla sbírána data, která byla následně analyzována, aby se identifikovaly vzory odlišné typyútoky.

Obrázek 1.16 – Schéma experimentu

Data toku, která slouží jako základ pro analýzu, byla shromážděna z okrajového routeru sítě Cisco 6509. Ke sběru dat z routeru byl použit kolektor nfdump NetFlow. Data NetFlow se exportují pro analýzu každých pět minut. Každých pět minut je generován soubor s parametry všech toků zaznamenaných v daném okamžiku na routeru. Tyto parametry jsou uvedeny v úvodu a zahrnují: čas spuštění streamu, trvání streamu, protokol přenosu dat, zdrojovou adresu a port, cílovou adresu a port, počet přenesených paketů, počet přenesených dat v bajtech.

V důsledku analýzy dat shromážděných při skenování sítě byl odhalen prudký nárůst počtu aktivních toků s téměř konstantním objemem přenášeného provozu (viz obr. 1.16). Každý skenovací počítač vygeneroval během 5 minut asi 10-20 tisíc velmi krátkých streamů (do velikosti 50 bajtů). Přitom celkový počet aktivních streamů na routeru, generovaných všemi uživateli, byl cca 50-60 tisíc.

Obrázek 1.17 ukazuje graf stavu sítě, počet dokončených toků N je vynesen na ose x a celkové zatížení kanálu v megabitech za sekundu (Mbit/s) je vyneseno na ose pořadnice. Každý bod v grafu odráží stav zkoumané sítě za předchozí pětiminutový interval a ukazuje závislost průměrného zatížení kanálu na počtu aktivních toků. Tečky odpovídají normálním stavům sítě a trojúhelníky stavům sítě zaznamenaným během skenování portů. Segmenty zobrazené v grafu a rovnoběžné s osou y ukazují intervaly spolehlivosti pro průměrné zatížení vypočítané pro pět intervalů průtoku (20000-30000, 30000-40000, 40000-50000, 50000-60000, 60000-70000).


Obrázek 1.17 – Skenování portů

Na základě výsledků experimentu s požadavky ping bylo zjištěno, že každý útočící počítač obdržel pouze jeden velmi dlouhý proud ICMP provozu, pokud byly požadavky odeslány na jediném portu. Vzhledem k tomu, že data o jednom toku se zapisují až po jeho dokončení, byla potřebná data zapsána do souboru nfdump až po dokončení útoku. Byl detekován jeden neobvykle dlouhý tok provozu ICMP; zdrojem byl útočící počítač. Na základě analýzy experimentálních dat tak bylo možné identifikovat útok typu ICMP flood. Je třeba poznamenat, že k dosažení výsledku - poruchy informační systém Jeden aktivní tok ICMP provozu zjevně nestačí, musí existovat desítky tisíc požadavků.

Analýza simulačního experimentu DDoS útoky Nástroj LOIC také ukázal prudký nárůst počtu aktivních vláken spolu s nárůstem přenášeného provozu. Obslužný program odesílá data paralelně na různé cílové porty, čímž vytváří velký počet krátké proudy trvající až minutu (viz obr. 1.18). Trojúhelníky znázorňují stavy sítě zaznamenané během útoku.


Obrázek 1.18 – DDoS útok

Ukázalo se tedy, že pomocí protokolu NetFlow je možné identifikovat nejen okamžik začátku útoku, ale také určit jeho typ. Detailní popis Algoritmy detekce útoků a práce na vytvoření zabezpečeného hostingu naleznete v následujících částech.

Literatura

1. Bolla R., Bruschi R. Hodnocení výkonu RFC 2544 a interní měření pro otevřený směrovač založený na Linuxu //Vysoce výkonné přepínání a směrování, 2006 Workshop on. – IEEE, 2006. – S. 6 s.

2. Fraleigh C. a kol. Měření provozu na úrovni paketů z páteřní sítě Sprint IP //IEEE. – 2003. – T. 17. – Č. 6. – str. 6-16.

3. Park K., Kim G., Crovella M. O vztahu mezi velikostmi souborů, přenosovými protokoly a sebepodobným síťovým provozem //Network Protocols, 1996. Proceedings., 1996 International Conference on. – IEEE, 1996. – s. 171-180.

4. Fred S. B. a kol. Statistické sdílení šířky pásma: studie přetížení na úrovni toku //ACM SIGCOMM Computer Communication Review. – ACM, 2001. – T. 31. – No. 4. – s. 111-122.

5. Barakat C. a kol. Model založený na toku pro internetový páteřní provoz //Sborník z 2. workshopu ACM SIGCOMM o měření internetu. – ACM, 2002. – s. 35-47.

6. Sukhov A. M. a kol. Aktivní toky v diagnostice řešení problémů na páteřních linkách //Journal of High Speed ​​​​Networks. – 2011. – T. 18. – Č. 1. – s. 69-81.

7. Skenování sítě Lyon G. F. Nmap: Oficiální průvodce projektem Nmap pro zjišťování sítě a bezpečnostní skenování. – Nejistý, 2009.

8. Haag P. Sledujte své toky s NfSen a NFDUMP //50. setkání RIPE. – 2005.

Rozdělení hodnocení pro stanovení prahových hodnot síťových proměnných a analýzu DDoS útoků

Úvod

Exponenciální růst internetového provozu a počtu informačních zdrojů je doprovázen rychlým nárůstem počtu anomálních síťových podmínek. Anomální podmínky sítě jsou vysvětleny jak člověkem, tak lidským faktorem. Rozpoznání anomálních stavů vytvořených útočníky je poměrně obtížné kvůli tomu, že napodobují akce běžní uživatelé. Proto je velmi obtížné identifikovat a blokovat takové anomální podmínky. Úkoly zajištění spolehlivosti a bezpečnosti internetových služeb vyžadují studium chování uživatelů na konkrétním zdroji.

Tento článek bude diskutovat o identifikaci anomálních síťových podmínek a metodách boje proti DDoS útokům. (Distributed Denial of Service, distribuovaný útok odmítnutí služby) je typ útoku, při kterém několik počítačů na internetu, nazývaných „zombie“, „boti“ nebo síť botů (botnet), začne na příkaz útočníka odesílat žádosti o službu od oběti. Když počet požadavků překročí kapacitu serverů oběti, nové požadavky od skutečných uživatelů již nebudou obsluhovány a stanou se nedostupnými. V tomto případě oběť utrpí finanční ztráty.

Studie popsané v této kapitole učebnice využívají jednotný matematický přístup. Byla identifikována řada nejdůležitějších síťových proměnných, které jsou generovány externí jedinou IP adresou při přístupu k danému serveru resp. lokální síť. Mezi tyto proměnné patří: frekvence přístupu k webovému serveru (na daném portu), počet aktivních vláken, množství příchozího provozu TCP, UDP a ICMP atd. Vybudovaná infrastruktura umožnila měřit hodnoty pro výše uvedené síťové proměnné.

Po nalezení těchto hodnot pro analyzované proměnné v libovolném časovém okamžiku je nutné sestrojit rozdělení pořadí. K tomu jsou nalezené hodnoty uspořádány v sestupném pořadí. Analýza stavů sítě bude provedena porovnáním odpovídajících rozdělení. Toto srovnání je zvláště jasné, když jsou rozdělení pro anomální a normální stav sítě vynesena do stejného grafu. Tento přístup usnadňuje určení hranice mezi normálními a anomálními stavy sítě.

Experimenty s DDoS útokem na službu lze provádět pomocí emulace v laboratorních podmínkách. Hodnota získaných výsledků je přitom výrazně nižší než při DDoS útoku na zprovozněnou komerční službu, jelikož emulátor nedokáže zcela reprodukovat skutečnou počítačovou síť. K úplnému pochopení principů a metod DDoS útoku je navíc nutná zkušenost s ním. Autoři proto anonymně souhlasili s provedením skutečného DDoS útoku na speciálně připravenou webovou službu. Během útoku byl zaznamenáván síťový provoz a shromažďovány statistiky NetFlow. Studie rozdělení pořadí pro počet toků a různé typy příchozího provozu generovaného jednou externí IP adresou, což umožnilo určit prahové hodnoty. Překročení prahových hodnot lze klasifikovat jako známku útočícího uzlu, což nám umožňuje vyvodit závěry o účinnosti detekčních metod a protiopatření.

1

1. Kudrin B.I. Úvod do technologie. – 2. vyd., přepracované, dodatečné. – Tomsk: TSU, 1993. – 552 s.

2. Matematický popis cenóz a technologické zákony. Filosofie a formování techniky / ed. BI. Kudrina // Cenologické studie. – sv. 1-2. – Abakan: Centrum pro systémový výzkum, 1996. – 452 s.

3. Gnatyuk V.I. Zákon optimální konstrukce technocenóz: monografie. – Číslo 29. Cenologický průzkum. – M.: Nakladatelství TSU – Centrum pro systémový výzkum, 2005. – 452 s. (http://www.baltnet.ru/~gnatukvi/ind.html).

4. Gurina R.V. Pořadová analýza vzdělávacích systémů (cenologický přístup): pokyny pro pedagogy. – Vydání 32. "Cenologický výzkum". – M.: Techhnetika, 2006. – 40 s. (http://www.gurinarv.ulsu.ru).

5. Gurina R.V., Dyatlova M.V., Khaibullov R.A. Pořadová analýza astrofyzikálních a fyzikálních systémů // Kazan Science. – 2010. – č. 2. – S. 8-11.

6. Gurina R.V., Lanin A.A. Meze použitelnosti zákona o rozdělení hodností // Technogenní samoorganizace a matematický aparát cenologického výzkumu. – sv. 28. "Cenologické studie." – M.: Centrum pro systémový výzkum, 2005. –P. 429-437.

7. Khaibullov R.A. Pořadová analýza vesmírných systémů // Novinky státního správního obvodu v Pulkově. Sborník příspěvků z druhé Pulkovské konference mládeže. – Petrohrad, 2009. – č. 219. – Vydání. 3. – s. 95-105.

8. Uchaikin M.V. Aplikace zákona o rozdělení hodností na objekty Sluneční soustavy // Zprávy o státní správní oblasti v Pulkově. Sborník příspěvků z druhé Pulkovské konference mládeže. – Petrohrad, 2009. – č. 219. – Vydání. 3. – s. 87-95.

Rozdělením pořadí (RD) se rozumí rozdělení získané jako výsledek postupu řazení posloupnosti hodnot parametrů přiřazených podle pořadí. Pořadí r je počet jednotlivce v pořadí v RR. Hodnocení je postup pro řazení objektů podle stupně vyjádření kvality v sestupném pořadí této kvality. Skutečná RR může být vyjádřena různými matematickými závislostmi a má odpovídající grafický vzhled, nejdůležitější jsou však hyperbolické rozdělení pořadí (HRD), protože odrážejí znak „cenózy“ - příslušnost k množině hodnocených objektů (prvků, jednotlivci) do cenóz. Teorii cenóz ve vztahu k technickým produktům vypracoval profesor MPEI B.I. Kudrin před více než 30 lety (www kudrinbi.ru) a úspěšně zaveden do praxe. Metody konstrukce geologického průzkumu a jejich následné využití k optimalizaci cenózy tvoří hlavní smysl rank analysis (RA) (cenologický přístup), jejíž obsah a technologie představují nový směr, který slibuje skvělé praktické výsledky. Zákon hyperbolického hodnostního rozložení jedinců v technocenóze (H-distribuce) má tvar:

W = A / r β (1)

kde W je seřazený parametr jednotlivců; r - pořadové číslo jednotlivce (1,2,3....); A je maximální hodnota parametru nejlepšího jedince s pořadím r = 1, tzn. v prvním bodě; β - pořadový koeficient charakterizující stupeň strmosti křivky PP (pro technocenózy 0,5< β < 1,5 ).

Pokud je jakýkoli parametr cenózy klasifikován, pak se PP nazývá klasifikační parametrický. Podřízení společenství jednotlivců zákonu geologického vývoje (1) je hlavním znakem cenózy, ale nestačí. Kromě této vlastnosti mají cenózy na rozdíl od jiných komunit obecné prostředí stanoviště a jeho objekty jsou zahrnuty do boje o zdroje.

V A. Gnatyuk vyvinul metodu RA pro optimalizaci technických systémů cenózy. Možnosti praktického využití RA v pedagogice popisuje R.V. Gurina (http://www.gurinarv.ulsu.ru), a také vyvinul metodiku pro její aplikaci v této oblasti. Počet jedinců v cenóze určuje sílu populace. Terminologie pochází z biologie, z teorie biocenóz. "Cenosis" je společenství. Termín biocenóza, který zavedl Mobius (1877), tvořil základ ekologie jako vědy. BI. Kudrin přenesl pojmy „cenóza“, „jedinec“, „populace“, „druh“ z biologie do technologie: v technologii jsou „jedinci“ jednotlivé technické produkty, Technické specifikace, a velký soubor technických výrobků (jednotlivců), jejichž RR je vyjádřena zákonem (1) se nazývá technocenóza.

V sociální sféra„jednotlivci“ jsou lidé organizovaní do sociálních skupin (tříd, studijních skupin), mocí populace je pak počet studentů ve skupině. Škola je také sociocenóza, skládající se z jednotlivců - jednotlivých strukturních jednotek - tříd. Zde je populační síla počtem tříd ve škole. Soubor škol je cenóza většího rozsahu, kde individuální, strukturní jednotkou této cenózy je škola. Hodnotící parametry W v technocenózách jsou technické nebo fyzikální parametry, které charakterizují jednotlivce, například velikost, hmotnost, spotřeba energie, energie záření atd. V sociocenózách, zejména pedagogických, jsou hodnocenými parametry akademický výkon, bodové hodnocení účastníků olympiád nebo testování; počet studentů přijatých na univerzity atd., a jednotlivci, kteří jsou hodnoceni, jsou samotní studenti, třídy, studijní skupiny, školy a tak dále.

Výzkumy posledních let ukázaly, že kolekce vesmírných objektů mnoha systémů (galaxie, sluneční soustava, kupy galaxií atd.) představují cenózy (kosmocenózy, astrocenózy). Astrocenózy se však od tenocenóz a sociocenóz liší tím, že člověk nemůže jejich stav ovlivnit, změnit a optimalizovat. Ve vesmíru jsou objekty navzájem pevně spojeny gravitačními silami, které určují jejich chování. Specifika astrocenóz nebyla plně objasněna, metoda RA ve vztahu k astrocenózám nebyla vyvinuta, což určilo účel této studie. Cíl byl rozdělen do několika úkolů:

1. Studium metody RA, stanovení možnosti aplikovatelnosti metody RA na astrofyzikální systémy-cenózy (tj. do jaké míry je RA aplikovatelná na astrocenózy).

2. Popis krok za krokem aplikace metody RA pro astrocenózy.

Po prostudování metodiky použití RA pro technocenózy byly identifikovány její společné (univerzální) prvky, které platí pro všechny typy cenóz. Metoda RA tedy zahrnuje následující kroky univerzálního postupu.

1. Identifikace cenózy - souboru studovaných objektů společenství (systému).

2. Identifikace parametrů hodnocení. Takovými parametry mohou být hmotnost, velikost objektů, náklady, energetická spolehlivost, procento prvků ve složení studovaného objektu, skóre účastníků testu Jednotné státní zkoušky atd.

3. Parametrický popis cenózy. Vytvoření tabulkového procesoru (databáze) obsahující systematizované informace o parametrech jednotlivých jedinců cenózy.

4. Konstrukce tabulkového empirického RR. Tabulkový RR je tabulka o dvou sloupcích: parametry jednotlivců W uspořádané podle hodnosti a pořadové číslo jednotlivce r (r = 1,2,3...). Na prvním místě je jedinec s maximální hodnotou parametru, na druhém místě jedinec s nejvyšší hodnotou parametru mezi ostatními jedinci atd.

5. Konstrukce grafického empirického RR. Graf empirické klasifikační křivky má tvar hyperboly: pořadové číslo r je vyneseno podél osy úsečky a studovaný parametr W je vynesen podél osy pořadnice, obr. 1, a. Obr. Všechny údaje jsou převzaty z tabulkového RR.

Rýže. 1. Hyperbola (a) a „upravená“ hyperbolická závislost na dvojité logaritmické škále (b); B = lnA

6. Aproximace empirické RR. Aproximace a stanovení parametrů PP se obvykle provádí pomocí počítačových programů, s jejich pomocí se nastaví interval spolehlivosti, zjistí se parametry distribuční křivky A a B a také se stanoví regresní koeficient Re (nebo Re2) zobrazující stupeň přiblížení empirické hyperboly k teoretické. V tomto případě je nakreslena aproximační ideální křivka (a v případě potřeby na obou jejích stranách - čáry intervalu spolehlivosti).

7. Linearizace GR: konstrukce empirického RR v logaritmických souřadnicích. Vysvětleme si proces linearizace závislosti (1). Vezmeme-li logaritmus závislosti (1) W = A / r β, dostaneme:

lnW = lnA - β ln r (2)

Určení:

lnW = y; lnA = B = konst; ln r = x, (3)

dostaneme (2) ve tvaru:

y = B - px. (4)

Rovnice (4) je klesající lineární funkcí (obr. 1, b). Pouze lnW je vyneseno podél svislé osy a lnr je vyneseno podél osy x. Pro sestavení lineárního grafu se sestaví tabulka empirických hodnot lnW a lnr, na základě kterých se pomocí počítačových programů sestaví graf závislosti lnW(lnr).

Ručně koeficient β je určen vzorcem:

β = tan α = lnA: ln r ,

koeficient A se určí z podmínky: r = 1, W1= A.

8. Aproximace empirické závislosti ln W (lnr) k lineární Y = B - β x.

Tento postup se také provádí pomocí počítačových programů; Následuje nalezení parametrů β, A, stanovení intervalu spolehlivosti, stanovení regresního koeficientu Re (nebo Re 2), vyjadřující míru aproximace empirického grafu ln W (ln r) k lineárnímu tvaru. V tomto případě se objeví přibližná přímka.

9. Optimalizace cenózy (pro bio, - techno, - sociocenózy).

Postup optimalizace systému (cenózy) spočívá ve spolupráci s tabulkovými a grafickými rozděleními a porovnání ideální křivky se skutečnou, načež se vyvodí závěr: co je prakticky potřeba v cenóze udělat, aby body skutečná křivka má tendenci ležet na ideální křivce. Čím více se empirická distribuční křivka blíží ideální křivce typu (1), tím je systém stabilnější. Fáze optimalizace zahrnuje následující procedury (akce).

Teoretická část: společná práce s tabulkovým a grafickým PP:

Hledání anomálních bodů a zkreslení v grafu;

Určení jejich souřadnic a jejich ztotožnění se skutečnými jedinci podle tabelovaného rozložení;

Praktická část: práce s reálnými objekty cenózy za účelem jejího vylepšení:

Analýza příčin anomálií a hledání cest k jejich odstranění (manažerské, ekonomické, výrobní atd.);

Eliminace anomálií v reálné cenóze.

Optimalizace technocenóz podle V.I. Gnatyuk se provádí dvěma způsoby:

1. Optimalizace nomenklatury - cílená změna v populaci cenózy, směřující skutečnou RR ve formě k ideálu (1). V biocenóze hejna se jedná o vyhnání nebo zničení slabých jedinců, v studijní skupina Toto je prověřování nedosažitelných, v technocenóze - zbavování se odpadků, přeměny použitého zařízení do kategorie šrotu.

2. Parametrická optimalizace - cílené zlepšování parametrů jednotlivých jedinců, vedoucí cenózu ke stabilnějšímu, efektivnějšímu stavu. V pedagogické cenóze - výchovné skupině (třídě) - jde o práci s nedospělými - zlepšování jejich výkonnostních ukazatelů v technocenóze - nahrazování starého zařízení vylepšenými modely;

Jak bylo uvedeno výše, optimalizační postup 9 není použitelný pro astrocenózy. Studiem jejich geologického průzkumu lze získat pouze tu či onu užitečnou vědeckou informaci o stavu astrocenózy, a tím rozšířit chápání astronomického obrazu světa. Jakou povahu mají odchylky při reálném geologickém průzkumu objektů astrofyzikálních cenóz od ideálního H-rozdělení a co naznačují? Na grafech geologického průzkumu objektů v systémech astrocenózy byly nalezeny dva typy zkreslení:

I. Několik bodů vypadne z intervalu spolehlivosti GRR nebo je hyperbola zkreslená (přítomnost „hrbů“, „údolí“, „ocasů“ (obr. 2, a).

II. Ostrý zlom v logaritmické přímce lnW (lnr), rozdělující ji na 2 segmenty (v úhlu k sobě nebo s posunem podél osy y).

Na obr. 2 jsou a, b - RR grafy satelitů Satup se zkresleními prvního typu.

Kvůli nedokonalosti měřicí techniky nebo metod astronomických měření jsou ze všech 62 satelitů Saturnu informace o hmotnostech 19 satelitů a průměrech 45 satelitů. Z grafů je jasně vidět, že v systému s velkým počtem jedinců (obr. 2, b) empirické body odrážející velikosti satelitů lépe zapadají na logaritmickou přímku, což naznačuje adekvátnější informaci o úplnosti systému. Výše uvedené nám umožňuje tvrdit, že použití RA umožňuje předpovídat přítomnost chybějících objektů ve vesmírných systémech.

Rýže. 2. Pořadové rozložení satelitů Saturnu na dvojité logaritmické stupnici ln W = f(ln r); r - pořadové číslo satelitu; a) družice RR 19 založené na známých hmotnostech; b) RR satelity ve stejném systému s velkým počtem jedinců - 45 satelitů známých průměrů

Při studiu grafických RR astrocenóz bylo zjištěno, že první typ zkreslení může naznačovat, že:

Některé objekty do této astrocenózy (systém, třída) nepatří;

Měření parametrů objektů astrocenózy není přesné;

Není dostatek informací o úplnosti astrofyzikálního systému-cenózy. Ve stejné době, než kompletnější systém, tím větší je regresní koeficient.

Druhý typ zkreslení naznačuje následující.

Pokud dojde k prudkému zlomu v rektifikačním grafu, znamená to, že systém se skládá ze dvou subsystémů. Podobný případ představují grafy na obr. 3, 4. Zároveň je v grafu W (r) ostrý zlom tvořen dvěma hyperbolami „lezoucími na sebe“ (obr. 3, a), přičemž tento zlom není vždy tak výrazný jako v graf na dvojité logaritmické stupnici (obr. 3 b, 4, b). Čím menší je úhel mezi linearizovanými segmenty na grafu ln W (ln r), tím výraznější je ohyb hyperboly na grafu W (r).

Na Obr. 3, a, b ukazují grafy geometrického rozložení známých galaxií podle vzdálenosti od naší Sluneční soustavy (celkem 40 objektů).

Pokud dojde k prudkému zlomu v rektifikačním grafu, znamená to, že systém se skládá ze dvou subsystémů. RA umožňuje teoreticky rozdělit systém galaxií do dvou tříd: periferní (vzdálená) skupina -1 a lokální (blízká) skupina galaxií - 2, což odpovídá údajům astronomické klasifikace.

Rýže. 3. Pořadové rozložení galaxií podle vzdálenosti od Sluneční soustavy, kde 1 je okrajová skupina galaxií, s Re=0,97; 2 - lokální skupina galaxií, Re=0,86; W je vzdálenost Galaxie, kpc; r je pořadové číslo galaxie. Celkem se jedná o 40 objektů. a) graf W(r), Re=0,97; b) Graf ln W= f(ln r), Re=0,86

Rýže. 4. PP hmotnosti planet Sluneční soustavy (v hmotnostech Země), kde skupina 1 - obří planety (Jupiter, Saturn, Uran, Neptun); 2 - terestrické planety; W je hmotnost planety M; r - pořadové číslo planety. Je zde celkem 8 objektů; a) Graf W(r), Re= 0,99; b) Graf ln W= f(ln r), pro 1 - (obří planety) Re = 0,86, pro 2 také - Re = 0,86

Jak víte z kurzu astronomie, náš planetární systém má 2 podsystémy: obří planety a pozemské planety. Na Obr. 4, a, b ukazuje geometrické rozložení planet sluneční soustavy podle hmotnosti. Všimněte si, že přímo na hyperbolických RR nemusí být zlomy jasně viditelné a není možné na nich identifikovat podsystémy (obr. 4, a), proto je nutné konstruovat RR na dvojité logaritmické stupnici, na které jsou zlomy jasně viditelné. vyjádřeno (obr. 4, b).

Použití referenčních knih fyzikální veličiny a internetový zdroj, byl zkonstruován geologický průzkum dalších astrocenóz, což potvrzuje výše uvedené. Aproximace byla provedena pomocí programu QtiPlot.

Tím pádem:

Metoda RA pro systémy cenózy je zvažována a popsána krok za krokem analogicky s technocenózami;

Byla stanovena specifičnost aplikace RA na astrocenózy;

Možnost využití RA pro studium astrofyzikálních systémů-cenóz byla stanovena v následujících plánech:

Identifikace subsystémů ve vesmírných systémech-cenózy; metoda spočívá ve stanovení a studiu zlomů grafů lineárního geologického průzkumu na dvojitém logaritmickém měřítku;

Předpovídání úplnosti astrofyzikálních systémů-cenóz;

K potvrzení vyvozených závěrů je nutný další výzkum v tomto směru.

Bibliografický odkaz

Ustinova K.A., Kozyrev D.A., Gurina R.V. ANALÝZA POŘADÍ JAKO METODA VÝZKUMU A MOŽNOST JEJÍ APLIKACE V ASTROFYZICKÝCH SYSTÉMECH // International Student Scientific Bulletin. – 2015. – č. 3-4.;
URL: http://eduherald.ru/ru/article/view?id=14114 (datum přístupu: 26. 12. 2019). Dáváme do pozornosti časopisy vydávané nakladatelstvím "Akademie přírodních věd"

George Zipf empiricky zjistil, že frekvence používání N-tého nejčastěji používaného slova v přirozených jazycích je přibližně nepřímo úměrná číslu N a byl popsán autorem v knize: Zipf G.R., Human Behaviour and the Principle of Least Effort, 1949

„Zjistil, že to je nejčastější věc anglický jazyk Slovo („the“) se používá desetkrát častěji než desáté nejčastější slovo, 100krát častěji než 100. nejčastější slovo a 1000krát častěji než 1000. nejčastější slovo. Kromě toho bylo zjištěno, že stejný model platí pro podíl na trhu software, nealkoholické nápoje, auta, sladkosti a za četnost přístupu na internetové stránky. [...] Ukázalo se, že téměř ve všech oblastech činnosti je být jedničkou mnohem lepší než být trojkou nebo desítkou. Navíc rozdělování odměn není v žádném případě rovnoměrné, zvláště v našem světě zapleteném do různých sítí. A na internetu jsou sázky ještě vyšší. Tržní kapitalizace společností Priceline, eBay a Amazon 95% celková tržní kapitalizace všech ostatních oblastí e-business. Vítěz bezpochyby dostane hodně."

Seth Godin, Idea Virus? Epidemický! Nechte zákazníky pracovat pro váš prodej, Petrohrad, „Peter“, 2005, str. 28.

„Význam tohoto fenoménu je takový […] Schopnost kreativních účastníků vstupovat do dokončených děl je rozdělena mezi účastníky v souladu se zákonem: součin počtu výskytů podle pořadí účastníka (podle počtu účastníků se stejnou četností výskytu) je konstantní hodnota : f r = konst. […] V žebříčku všech kreativních účastníků, v v tomto případě slovy, je to právě vlastnost nerovnoměrného rozložení schopnosti migrace, která se odhaluje a s tím i vzorec spojení mezi kvantitou a kvalitou v tvůrčí činnosti obecně. […]

Kromě literárních zdrojů Zipf zkoumal mnoho dalších jevů podezřelých z rozložení hodností – od rozložení obyvatelstva napříč městy po uspořádání nástrojů na truhlářském pracovním stole, knih na vědeckém stole a polici, všude narážející na stejný vzorec.

Bez ohledu na Zipf byla odhalena úzká distribuce Pareto při studiu bankovních vkladů, Urquhartem při analýze žádostí o literaturu, Zásobník v rozboru autorovy produktivity vědců. I bohové Olympu se z hlediska jejich zatížení funkcemi generujícími a uchovávajícími dovednosti chovají podle Zipfova zákona.

Prostřednictvím úsilí Cena a jeho kolegů a později díky úsilí mnoha vědců bylo zjištěno, že zákon Zipf má přímý vliv na tvorbu cen ve vědě.

Cena při této příležitosti píše: „Všechna data spojená s distribucí takových charakteristik, jako je stupeň dokonalosti, užitečnost, produktivita, velikost, podléhají několika neočekávaným, ale jednoduchým vzorům. [...] Je přesný tvar tohoto rozdělení lognormální nebo geometrický nebo inverzní čtverec nebo podléhá zákonu Zipf, je předmětem specifikace pro každé jednotlivé odvětví. Co víme, je konstatování samotného faktu, že kterýkoli z těchto distribučních zákonů poskytuje výsledky blízké empirickým výsledkům v každém ze zkoumaných odvětví a že takový jev společný všem průmyslovým odvětvím je zjevně výsledkem působení jednoho zákona.“ Price D., Regular Patterns in the Organization of Science, Organon, 1965, č. 2., s. 246».

Petrov M.K. , Umění a věda. Piráti z Egejského moře a osobnost, M., „Ruská politická encyklopedie, 1995, s. 153-154.

Kromě, Jiří Zipf také zjistili, že nejčastěji používaná slova jazyka, který existuje po dlouhou dobu, jsou kratší než ostatní. Časté používání je opotřebovalo...