Pamamahagi ng ranggo. International student scientific newsletter Pagsusuri ng ranggo bilang paraan ng pananaliksik

Ang unang bagay na nakakaakit ng pansin sa larangan ng mga dokumento ay ang napakabilis na paglaki ng populasyon nito.

Ang kilalang katotohanang ito ay gumagawa sa atin ng seryosong pag-iisip tungkol sa kung ano ang maaaring humantong sa gayong paglago. Ngunit marahil ang aming mga takot ay walang kabuluhan, at sa hinaharap ang rate ng paglago ng bilang ng mga dokumento ay bumagal? Sa ngayon, ang mga istatistika ay nagpapakita ng kabaligtaran.

Ganito, halimbawa, ang mga daloy ng impormasyon sa dokumentaryo sa kimika ay nagbago. Noong 1732, ang buong pamana ng kimika ay naibuod at inilathala ng isang propesor ng Dutch sa isang aklat na may 1433 na pahina. Noong 1825, inilathala ng Swedish scientist na si Berzelius ang lahat ng nalalaman sa chemistry sa 8 volume na may kabuuang dami na 4150 na pahina. Sa kasalukuyan, ang American abstract journal na Chemical Abstracts, na inilathala mula noong 1907, ay naglalathala ng halos lahat ng impormasyon sa chemistry, na ang unang milyong abstract ay nai-publish 31 taon pagkatapos ng pagkakatatag nito, ang pangalawa pagkatapos ng 18 taon, ang pangatlo pagkatapos ng 7 taon, at ikaapat - sa 4 na taon. !

Humigit-kumulang sa parehong pattern ng paglago sa bilang ng mga dokumento ay maaaring masubaybayan sa iba pang mga lugar ng agham. Napagmasdan na ang paglaki ng mga dokumento ay exponential. Kasabay nito, ang taunang pagtaas ng daloy pang-agham at teknikal na impormasyon ay 7...10%. Sa kasalukuyan, bawat 10...15 taon ay dumodoble ang dami ng siyentipiko at teknikal na impormasyon (STI). Ang kurba ng paglaki ng bilang ng mga dokumento, samakatuwid, ay maaaring ilarawan ng isang exponent ng form

y = Ae kt

saan y– ang kabuuan ng kaalaman na minana mula sa mga nakaraang henerasyon, e– ang batayan ng natural logarithms ( e = 2,718...), t– index ng oras (g); A– ang kabuuan ng kaalaman sa simula ng countdown (na may t = 0), K– koepisyent na nagpapakilala sa bilis ng kaalaman, ang katumbas nito ay itinuturing na mga daloy ng pang-agham at teknikal na impormasyon. Sa t≈ 10...15 taon sa = 2A.

Madaling isipin na ang ganitong uri ng paglaki sa bilang ng mga siyentipikong dokumento ay hindi maganda para sa atin sa hinaharap, kahit na sa malapit na hinaharap. Ang mga kagubatan ay naging mga bundok ng papel kung saan nalulunod ang isang walang magawang mananaliksik...

Gayunpaman, tulad ng ipinapakita ng kasaysayan ng agham at teknolohiya, ang mga kondisyon kung saan sila nabuo ay hindi pare-pareho, at samakatuwid ang mekanismo ng exponential growth ng mga daloy ng STI ay madalas na naaabala. Ang paglabag na ito ay ipinaliwanag sa pamamagitan ng ilang mga salik na pumipigil, sa partikular na mga digmaan, kakulangan ng materyal at yamang tao atbp. Sa katotohanan, ang pagtaas sa bilang ng mga dokumento samakatuwid ay hindi sumusunod sa isang exponential dependence, bagaman sa ilang mga panahon ng pag-unlad ng agham at teknolohiya sa ilang mga larangan ng kaalaman ito ay nagpapakita ng sarili nitong malinaw. Ano ang dahilan ng mabilis na pagtaas ng daloy ng dokumentaryong impormasyon?



Sa nakaraang mga seksyon, iginuhit namin ang pansin sa katotohanan na ang impormasyon ay gumaganap ng malaking papel sa pag-unlad lipunan ng tao, samakatuwid ito ay sinamahan ng isang pinabilis na paglaki sa dami ng impormasyon. taas mga batis ng dokumentaryo maaaring maiugnay ang siyentipikong impormasyon sa pagtaas ng bilang ng mga tagalikha ng siyentipikong impormasyon. Ang rate ng paglago na ito ay inilalarawan ng isang exponential function. Halimbawa, sa nakalipas na 50 taon, ang bilang ng mga siyentipiko sa USSR ay nadoble tuwing 7 taon, sa USA - bawat 10 taon, sa mga bansang European - bawat 10...15 taon.

Siyempre, ang rate ng paglaki sa bilang ng mga manggagawang siyentipiko ay dapat bumagal at umabot sa ilang higit pa o hindi gaanong pare-parehong halaga kaugnay sa buong populasyon ng nagtatrabaho. Kung hindi, pagkatapos ng ilang oras ang buong populasyon ay magiging abala sa gawaing pananaliksik at pagpapaunlad, na hindi makatotohanan. Samakatuwid, dapat nating asahan ang paghina sa rate ng paglago ng mga siyentipikong dokumento sa hinaharap. Sa kasalukuyan, mataas pa rin ang mga rate na ito at nababalisa ang mga mamimili ng impormasyon: paano mag-imbak at magproseso ng mga dokumento, paano mahahanap ang kailangan nila sa kanila?

Ang sitwasyon ay tila walang pag-asa: ang batas ng exponential growth ng mga dokumento na ipinapatupad pa rin sa kaharian ng mga dokumento ay mahigpit na pinalubha ang parehong mga problema sa "pabahay" at "transportasyon" dito.

Gayunpaman, sa lumalabas, mayroong isang batas dito na medyo nagpapalambot sa kasalukuyang sitwasyon...

Sa pagtatapos ng 40s ng ating siglo, si J. Zipf, na nakolekta ng napakalaking istatistikal na materyal, ay sinubukang ipakita na ang pamamahagi ng mga salita sa isang natural na wika ay sumusunod sa isang simpleng batas na maaaring buuin. sa sumusunod na paraan. Kung gagawa ka ng isang listahan ng lahat ng mga salita na matatagpuan sa isang sapat na malaking teksto, pagkatapos ay ayusin ang mga salitang ito sa pababang pagkakasunud-sunod ng dalas ng paglitaw ng mga ito sa tekstong ito at bilangin ang mga ito sa pagkakasunud-sunod mula 1 (ang serial number ng pinakamadalas na paglitaw ng salita) hanggang R, pagkatapos ay para sa anumang salita ang produkto ng serial number nito (ranggo) / sa naturang listahan at ang dalas ng paglitaw nito sa teksto ay magiging pare-pareho ang halaga, na may humigit-kumulang na parehong halaga para sa anumang salita mula sa listahang ito. Analytically, ang batas ng Zipf ay maaaring ipahayag bilang



fr = c,

saan f– dalas ng paglitaw ng isang salita sa teksto;
r– ranggo (ordinal na numero) ng salita sa listahan;
Sa– empirical na pare-parehong halaga.

Ang nagresultang pag-asa ay graphic na ipinahayag ng isang hyperbola. Sa gayon, napagmasdan ang iba't ibang uri ng mga teksto at wika,

kasama ang mga wikang libu-libong taong gulang, itinayo ni J. Zipf ang ipinahiwatig na mga dependency para sa bawat isa sa kanila, habang ang lahat ng mga kurba ay may parehong hugis - ang hugis ng isang "hyperbolic staircase", i.e. kapag pinapalitan ang isang teksto ng isa pa pangkalahatang katangian hindi nagbago ang pamamahagi.

Ang batas ni Zipf ay natuklasan sa eksperimento. Nang maglaon, iminungkahi ni B. Mandelbrot ang teoretikal na katwiran nito. Naniniwala siya na ang nakasulat na wika ay maihahambing sa coding, na ang lahat ng mga palatandaan ay may tiyak na "halaga." Batay sa mga kinakailangan para sa pinakamababang halaga ng mga mensahe, mathematical na nakarating si B. Mandelbrot sa isang relasyon na katulad ng batas ni Zipf

fr γ = c ,

kung saan ang γ ay isang halaga (malapit sa pagkakaisa) na maaaring mag-iba depende sa mga katangian ng teksto.

Nalaman ni J. Zipf at iba pang mga mananaliksik na hindi lamang lahat ng mga likas na wika sa mundo ang napapailalim sa naturang pamamahagi, kundi pati na rin ang iba pang mga phenomena ng isang panlipunan at biological na kalikasan: ang pamamahagi ng mga siyentipiko sa bilang ng mga artikulo na kanilang nai-publish (A. Lotka, 1926), mga lungsod sa US ayon sa populasyon ng populasyon (J. Zipf, 1949), populasyon ayon sa kita sa mga kapitalistang bansa (V. Pareto, 1897), biological genera ayon sa bilang ng mga species (J. Willis, 1922), atbp.

Ang pinakamahalagang bagay para sa problema na aming isinasaalang-alang ay ang katotohanan na ang mga dokumento sa loob ng anumang sangay ng kaalaman ay maaaring ipamahagi ayon sa batas na ito. Ang isang espesyal na kaso nito ay ang batas ni Bradford, na direktang nauugnay hindi sa pamamahagi ng mga salita sa teksto, ngunit sa pamamahagi ng mga dokumento sa loob ng isang partikular na lugar na pampakay.

Ang English chemist at bibliographer na si S. Bradford, na nagsusuri ng mga artikulo sa inilapat na geophysics at lubrication, ay napansin na ang pamamahagi ng mga siyentipikong journal na naglalaman ng mga artikulo sa pagpapadulas at mga journal na naglalaman ng mga artikulo sa inilapat na geophysics ay nagkaroon pangkalahatang anyo. Batay sa itinatag na katotohanan, si S. Bradford ay bumalangkas ng isang pattern ng pamamahagi ng mga publikasyon sa mga publikasyon.

Ang pangunahing kahulugan ng pattern ay ang mga sumusunod: kung mga siyentipikong journal ayusin sa pababang pagkakasunud-sunod ng bilang ng mga artikulo sa pamamagitan ng tiyak na isyu, kung gayon ang mga journal sa resultang listahan ay maaaring hatiin sa tatlong zone upang ang bilang ng mga artikulo sa bawat zone sa isang partikular na paksa ay pareho. Kasabay nito, ang unang sona, ang tinatawag na core zone, ay kinabibilangan ng mga dalubhasang journal na direktang nakatuon sa paksang tinatalakay. Ang bilang ng mga espesyal na journal sa pangunahing lugar ay maliit. Ang pangalawang zone ay nabuo ng mga journal na bahagyang nakatuon sa isang partikular na lugar, at ang kanilang bilang ay tumataas nang malaki kumpara sa bilang ng mga journal sa core. Ang ikatlong sona, ang pinakamalaki sa mga tuntunin ng bilang ng mga publikasyon, ay nagkakaisa ng mga magasin na ang mga paksa ay napakalayo sa paksang tinatalakay.

Kaya, na may pantay na bilang ng mga publikasyon sa isang partikular na paksa sa bawat zone, ang bilang ng mga pamagat ng journal ay tumataas nang husto kapag lumilipat mula sa isang zone patungo sa isa pa. Nalaman ni S. Bradford na ang bilang ng mga magazine sa ikatlong zone ay magiging humigit-kumulang na mas maraming beses kaysa sa pangalawang zone, kung gaano karaming beses ang bilang ng mga pamagat sa pangalawang zone ay mas malaki kaysa sa una. Tukuyin natin R 1 – bilang ng mga magazine sa 1st zone, R 2 - sa ika-2, R 3 – bilang ng mga magazine sa 3rd zone.

Kung a– ang ratio ng bilang ng mga magazine sa 2nd zone sa bilang ng mga magazine sa 1st zone, kung gayon ang pattern na natuklasan ni S. Bradford ay maaaring isulat tulad ng sumusunod:

P 1: P 2: P 3 = 1: a : a 2

P 3: P 2 = P 2: P 1 = a.

Ang relasyong ito ay tinatawag na batas ni Bradford.

B. Pino ni Vickery ang modelo ni S. Bradford. Nalaman niya na ang mga journal, na niraranggo (nakaayos) sa pagpapababa ng pagkakasunud-sunod ng mga artikulo sa isang partikular na isyu, ay maaaring hatiin hindi sa tatlong zone, ngunit sa anumang nais na bilang ng mga zone. Kung ang mga peryodiko ay inayos sa pagkakasunud-sunod ng pagbaba ng bilang ng mga artikulo sa isang partikular na isyu, kung gayon sa nagresultang listahan ay maaaring makilala ang isang bilang ng mga zone, na ang bawat isa ay naglalaman ng parehong bilang ng mga artikulo. Tinatanggap namin ang sumusunod na notasyon X– bilang ng mga artikulo sa bawat zone. T x– bilang ng mga journal na naglalaman ng X mga artikulo, T 2x– bilang ng mga log na naglalaman ng 2 X mga artikulo, i.e. ang kabuuan ng mga pamagat ng journal sa 1st at 2nd zone, T 3x– bilang ng mga log na naglalaman ng 3 X mga artikulo, i.e. ang kabuuan ng mga pamagat ng journal sa 1st, 2nd at 3rd zone, T 4x– bilang ng mga log na naglalaman ng 4 X mga artikulo.

Pagkatapos ang pattern na ito ay magiging hitsura

Tx : T 2x : T 3x : T 4x : ... = 1: a : a 2: a 3: ...

Ang pananalitang ito ay tinatawag na batas ni Bradford bilang interpretasyon ni B. Vickery.

Kung ang batas ng Zipf ay naglalarawan ng maraming phenomena ng isang panlipunan at biyolohikal na kalikasan, kung gayon ang batas ni Bradford ay isang partikular na kaso ng pamamahagi ng Zipf para sa sistema ng mga peryodiko sa agham at teknolohiya.

Mula sa mga pattern na ito ay maaaring gumawa ng mga konklusyon ng napakalaking praktikal na benepisyo.

Kaya, kung ayusin mo ang anumang mga periodical sa pababang pagkakasunud-sunod ng bilang ng mga artikulo sa isang tiyak na profile, kung gayon, ayon kay Bradford, maaari silang hatiin sa tatlong grupo na naglalaman ng pantay na bilang ng mga artikulo. Pumili tayo ng grupo ng 8 pamagat ng journal na sumasakop sa unang 8 lugar sa resultang listahan. Pagkatapos, upang madoble ang bilang ng mga artikulo sa profile na interesado kami, kailangan naming magdagdag ng isa pang 8 sa umiiral na 8 a pamagat ng mga magasin. Kung a= 5 (ang halagang ito ay natagpuan sa eksperimentong paraan para sa ilang mga pampakay na lugar), kung gayon ang bilang ng mga pamagat na ito ay 40. Pagkatapos ay ang kabuuang bilang ng mga pamagat ng mga periodical ay magiging 48, na, siyempre, ay higit sa 8. Kung susubukan nating makakuha ng tatlong beses na mas maraming mga artikulo, kailangan nating saklawin ang 8 + 5 · 8 + 5 2 · 8 = 256 na mga item! Sa mga ito, ang isang third ng mga artikulo na interesado kami ay puro sa 8 journal lamang, i.e. Ang mga artikulo ay ipinamamahagi nang hindi pantay sa mga pamagat ng journal. Sa isang banda, mayroong isang konsentrasyon ng isang makabuluhang bilang ng mga artikulo sa isang tiyak na paksa sa ilang mga espesyal na journal, sa kabilang banda, mayroong isang pagpapakalat ng mga artikulong ito sa isang malaking bilang mga publikasyon sa mga nauugnay o malalayong paksa mula sa paksang isinasaalang-alang, habang sa pagsasagawa ay kinakailangan upang matukoy ang mga pangunahing mapagkukunan sa lugar ng kaalamang pang-agham at teknikal na interes sa amin, at hindi mga random na publikasyon.

Ang mga pattern ng konsentrasyon at pagpapakalat ng pang-agham at teknikal na impormasyon sa larangan ng mga dokumento ay ginagawang posible na piliin nang tumpak ang mga publikasyong iyon na malamang na naglalaman ng mga publikasyon na tumutugma sa isang tiyak na profile ng kaalaman. Sa isang mass process suporta sa impormasyon Sa pambansang saklaw, ang paggamit ng mga batas na ito ay ginagawang posible upang mabawasan ang malaking gastos para sa pambansang ekonomiya.

Ang kasalukuyang pagkakalat ng mga publikasyon ay hindi maaaring masuri lamang bilang isang mapanganib na kababalaghan. Sa isang dispersed na kapaligiran, ang mga pagkakataon para sa cross-industry na pagpapalitan ng impormasyon ay bumubuti.

Isang pagtatangka na ituon ang lahat ng mga publikasyon ng isang profile sa ilang mga journal, i.e. Ang pagpigil sa mga ito mula sa pag-alis ay magkakaroon ng mga negatibong kahihinatnan, hindi banggitin ang katotohanan na ang tumpak na pagtatalaga ng isang dokumento sa isa o ibang profile ay hindi palaging posible.

Ang mga resulta ng mga pagsubok ng batas sa pagpapakalat ni Bradford, tulad ng ipinakita ni S. Brooks, ay may iba't ibang antas ng kasunduan. Sa kabila ginawang pagbabago, ang modelong Bradford ay hindi sumasalamin sa pagkakaiba-iba ng mga tunay na pamamahagi. Ang pagkakaibang ito ay maaaring ipaliwanag sa pamamagitan ng katotohanan na ginawa ni Bradford ang kanyang mga konklusyon batay sa pagpili ng mga array na nauugnay lamang sa makitid na mga lugar na pampakay.

Ang dakilang merito nina J. Zipf at S. Bradford ay pinasimulan nila ang isang mahigpit na pag-aaral ng mga documentary information flow (DIF), na mga koleksyon ng mga siyentipikong dokumento, publikasyon at hindi nai-publish na mga materyales (halimbawa, mga ulat sa gawaing pananaliksik at pagpapaunlad ). Ang karagdagang pananaliksik, kung saan ang isang kilalang lugar ay inookupahan ng gawain ng espesyalista ng Sobyet sa larangan ng computer science V.I. Gorkova, ay nagpakita na posible na matukoy hindi lamang ang dami ng mga parameter ng mga hanay ng mga pang-agham na dokumento, kundi pati na rin ang mga hanay ng mga elemento ng mga katangian ng mga siyentipikong dokumento: mga may-akda, mga termino, mga indeks ng mga sistema ng pag-uuri, mga pamagat ng mga publikasyon, i.e. mga pangalan ng mga elemento na nagpapakilala sa nilalaman ng mga siyentipikong dokumento. Halimbawa, maaari mong ayusin ang mga journal sa pababang pagkakasunud-sunod ng bilang ng mga may-akda na nai-publish sa kanila, sa pababang pagkakasunud-sunod ng average na laki ng mga artikulo na nai-publish sa kanila, o mag-order ng koleksyon ng mga dokumento ng alinman sa mga elemento nito.

Ang pagkakasunud-sunod ay natutukoy sa pamamagitan ng pagraranggo (placement order) ng mga pangalan ng mga elemento ayon sa dalas ng kanilang paglitaw sa pababang pagkakasunud-sunod. Ang nasabing isang nakaayos na hanay ng mga pangalan ng elemento ay tinatawag na pamamahagi ng ranggo. Ang mga distribusyon na minsang pinag-aralan ni Zipf ay tipikal na mga halimbawa mga pamamahagi ng ranggo. Ito ay lumabas na ang uri ng pamamahagi ng ranggo at ang istraktura nito ay nagpapakilala sa hanay ng mga dokumento kung saan nabibilang ang isang naibigay na pamamahagi ng ranggo. Ito ay lumabas na kapag itinayo, ang mga pamamahagi ng ranggo sa karamihan ng mga kaso ay may anyo ng batas ng Zipf na may pagwawasto ng Mandelbrot:

fr γ = c.

Sa kasong ito, ang coefficient γ ay isang variable na halaga. Ang constancy ng coefficient γ ay pinananatili lamang sa gitnang seksyon ng distribution graph. Ang seksyon na ito ay nasa anyo ng isang tuwid na linya kung ang graph ng pattern sa itaas ay naka-plot sa logarithmic coordinates. Seksyon ng pamamahagi na may γ = const ay tinatawag na gitnang sona ng pamamahagi ng ranggo (ang halaga ng argumento sa lugar na ito ay nag-iiba mula sa Inr 1, hanggang sa Inr 2). Mga halaga ng argumento mula 0 hanggang Inr 1 ay tumutugma sa zone ng kernel ng pamamahagi ng ranggo, at ang mga halaga ng argumento mula sa Inr 2 hanggang Inr 3 – ang tinatawag na truncation zone.

Ano ang kahulugan ng pagkakaroon ng tatlong malinaw na nakikilalang mga sona ng mga pamamahagi ng ranggo? Kung ang huli ay tumutukoy sa mga terminong bumubuo sa anumang larangan ng kaalaman, kung gayon ang nuclear zone, o ang zone ng core ng rank distribution, ay naglalaman ng pinakakaraniwang ginagamit, pangkalahatang mga pang-agham na termino. Ang gitnang sona ay naglalaman ng mga terminong pinaka-katangian ng isang partikular na larangan ng kaalaman, na magkakasamang nagpapahayag ng pagiging tiyak nito, ang pagkakaiba nito sa iba pang mga agham, at "sinasaklaw ang pangunahing nilalaman nito." Ang truncation zone ay naglalaman ng mga termino na medyo bihirang ginagamit sa larangang ito ng kaalaman.

Kaya, ang batayan ng bokabularyo ng anumang larangan ng kaalaman ay puro sa gitnang sona ng pamamahagi ng ranggo. Gamit ang mga termino ng nuclear zone, ang lugar na ito ng kaalaman ay "sumali sa mas pangkalahatang mga lugar ng kaalaman," at ang truncation zone ay gumaganap ng papel ng isang avant-garde, na parang "naghahapo" para sa mga koneksyon sa iba pang mga sangay ng agham. Kaya, kung ilang taon na ang nakalilipas sa pamamahagi ng ranggo ng mga termino sa thematic na lugar na "Pagproseso ng metal" ang terminong "laser" ay matatagpuan, kung gayon dahil sa mababang paglitaw nito ay tiyak na nahulog ito sa truncation zone: ang mga koneksyon sa pagitan ng Ang teknolohiya ng laser at pagpoproseso ng metal ay “ginagapang” lang " Gayunpaman, ngayon ang terminong ito ay, nang walang pag-aalinlangan, ay mahuhulog sa gitnang sona, na magpapakita ng medyo mataas na pangyayari at, samakatuwid, ang matatag na koneksyon ng teknolohiya ng laser na may pagproseso ng metal.

Puno na ang graph ng pamamahagi ng ranggo malalim na kahulugan: kung tutuusin kamag-anak na laki ng isang partikular na sona sa graph ay maaaring gamitin upang hatulan ang mga katangian ng buong larangan ng kaalaman. Ang isang graph na may malaking core zone at isang maliit na truncation zone ay kabilang sa isang medyo malawak at malamang na konserbatibong lugar ng kaalaman. Ang mga dinamikong sangay ng agham ay nailalarawan sa pamamagitan ng pagtaas ng truncation zone. Ang maliit na sukat ng nuclear zone ay maaaring magpahiwatig ng pagka-orihinal ng larangan ng kaalaman kung saan nabibilang ang itinayong pamamahagi ng ranggo, atbp. Kaya, batay sa pagsusuri ng pamamahagi ng ranggo, naging posible na magbigay ng mga pagtatasa ng husay ng mga daloy ng impormasyon sa dokumentaryo alinsunod sa mga sangay ng agham kung saan sila nabuo. Ang kaharian ng mga dokumento ay may hugis ng isang sistema kung saan ang mga elemento ay magkakaugnay, at ang mga pattern na namamahala sa mga koneksyon na ito ay maaaring pag-aralan!

Paano nasa edad ang impormasyon...

Pagtanda... Ang kahulugan ng konseptong ito ay hindi nangangailangan ng paliwanag, ito ay kilala ng lahat. Ang ating planeta ay tumatanda, at ang mga puno ay tumatanda na. Ang mga bagay at ang mga taong nagmamay-ari nito ay tumatanda. Tumatanda na rin ang mga dokumento. Ang mga pahina ng libro ay nagiging dilaw, ang mga titik ay kumukupas, ang mga pabalat ay nawasak. Ngunit ano ito? Isang mag-aaral, na itinatanggi ang isang aklat na inaalok sa kanya sa silid-aklatan, na walang kabuluhang sinabi: "Ito ay luma na!", bagaman ang aklat ay mukhang bago pa rin! Siyempre, walang sikreto dito. Ang aklat ay bago, ngunit ang impormasyong nilalaman nito ay maaaring luma na. Kaugnay ng mga dokumento, ang pagtanda ay nauunawaan hindi bilang pisikal na pagtanda ng tagapagdala ng impormasyon, ngunit bilang isang medyo kumplikadong proseso ng pagtanda ng impormasyong nakapaloob dito. Sa panlabas, ang prosesong ito ay nagpapakita ng sarili sa pagkawala ng interes ng mga siyentipiko at mga espesyalista sa mga publikasyon habang lumipas ang panahon mula nang tumaas ang kanilang publikasyon. Ayon sa isang survey ng 17 mga aklatan na isinagawa ng isa sa mga katawan ng impormasyon sa industriya ay nagpakita, 62% ng mga hit ay para sa mga journal na wala pang 1.5 taong gulang; 31% ng mga kahilingan ay para sa mga magazine na 1.5...5 taong gulang; 6% - para sa mga magazine na may edad mula 6 hanggang 10 taon; 7% – para sa mga magazine na higit sa 10 taong gulang. Ang mga publikasyong nai-publish na medyo matagal na ang nakalipas ay mas madalas na kumunsulta, na nagiging sanhi ng assertion na ang mga ito ay lipas na. Anong mga mekanismo ang kumokontrol sa proseso ng pagtanda ng mga dokumento?

Ang isa sa mga ito ay direktang nauugnay sa pagsasama-sama, pagsasama-sama ng impormasyong pang-agham. Kadalasan, ang materyal na nangangailangan ng isang buong kurso ng mga lektura upang ipakita isang daang taon na ang nakalipas ay maaari na ngayong ipaliwanag sa loob ng ilang minuto gamit ang dalawa o tatlong formula. Ang kaukulang mga kurso sa panayam ay wala nang pag-asa: wala nang gumagamit nito.

Kapag nakuha na ang mga mas tumpak, ang tinatayang data, at samakatuwid ang mga dokumento kung saan nai-publish ang mga ito, ay nagiging lipas na. Samakatuwid, kapag pinag-uusapan nila ang pagtanda ng impormasyong pang-agham, madalas nilang nangangahulugang paglilinaw nito, isang mas mahigpit, maigsi at pangkalahatan na pagtatanghal sa proseso ng paglikha ng bagong impormasyong pang-agham. Ito ay posible dahil sa ang katunayan na ang siyentipikong impormasyon ay may pag-aari ng pinagsama-samang, i.e. nagbibigay-daan para sa isang mas maigsi, pangkalahatan na pagtatanghal.

Minsan ang pagtanda ng impormasyon sa dokumentaryo ay may ibang mekanismo: ang bagay, ang paglalarawan kung saan mayroon tayo, ay nagbabago nang husto sa paglipas ng panahon na ang impormasyon tungkol dito ay nagiging hindi tumpak. Ganyan sila tumatanda heograpikal na Mapa: ang mga disyerto ay pinalitan ng mga pastulan, lumitaw ang mga bagong lungsod at dagat.

Ang proseso ng pagtanda ay maaari ding tingnan bilang pagkawala ng impormasyon ng praktikal na kapakinabangan para sa mamimili. Nangangahulugan ito na hindi na niya ito magagamit upang makamit ang kanyang mga layunin.

At sa wakas, ang prosesong ito ay maaaring isaalang-alang mula sa pananaw ng mga pagbabago sa thesaurus ng isang tao. Mula sa mga posisyong ito, ang parehong impormasyon ay maaaring "luma na" para sa isang tao at "hindi napapanahon" para sa isa pa.

Ang antas ng pagtanda ng impormasyon sa dokumentaryo ay hindi pareho para sa iba't ibang uri mga dokumento. Ang rate ng pagtanda nito ay naiimpluwensyahan sa iba't ibang antas ng maraming mga kadahilanan. Ang mga tampok ng pagtanda ng impormasyon sa bawat larangan ng agham at teknolohiya ay hindi maaaring mahihinuha sa batayan ng abstract na pagsasaalang-alang o average na istatistikal na data - ang mga ito ay organikong nauugnay sa mga uso sa pag-unlad ng bawat isa. hiwalay na industriya Agham at teknolohiya.

Upang kahit papaano ma-quantify ang rate ng pagtanda ng impormasyon, ang librarian na si R. Barton at physicist na si R. Kebler mula sa USA, sa pamamagitan ng pagkakatulad sa kalahating buhay ng mga radioactive substance, ay nagpakilala ng "half-lifes" ng mga siyentipikong artikulo. Ang kalahating buhay ay ang oras kung saan ang kalahati ng lahat ng kasalukuyang ginagamit na literatura sa anumang larangan o paksa ay nai-publish. Kung ang kalahating buhay ng mga publikasyon sa pisika ay 4.6 taon, nangangahulugan ito na 50% ng lahat ng kasalukuyang ginagamit (nabanggit) na mga publikasyon sa larangang ito ay hindi hihigit sa 4.6 taong gulang. Narito ang mga resulta na nakuha nina Barton at Kebler: para sa mga publikasyon sa pisika - 4.6 taon, pisyolohiya - 7.2, kimika - 8.1, botany - 10.0, matematika - 10.5, geology - 11.8 taon. Gayunpaman, kahit na ang pag-aari ng pag-iipon ng impormasyon ay layunin sa kalikasan, hindi ito nagbubunyag ng panloob na proseso ng pag-unlad ng isang naibigay na lugar ng kaalaman at sa halip ay naglalarawan sa kalikasan. Samakatuwid, ang mga konklusyon tungkol sa pagtanda ng impormasyon ay dapat tratuhin nang maingat.

Gayunpaman, kahit na ang isang magaspang na pagtatantya ng rate ng pagtanda ng impormasyon at mga dokumentong naglalaman nito ay may napakalaking praktikal na halaga: nakakatulong na panatilihing tingnan lamang ang bahaging iyon ng kaharian ng dokumento kung saan, malamang, mayroong mga dokumentong naglalaman ng pangunahing impormasyon tungkol sa isang ibinigay agham. Ito ay mahalaga hindi lamang para sa mga empleyado ng siyentipiko at teknikal na mga aklatan at siyentipiko at teknikal na mga katawan ng impormasyon, kundi pati na rin para sa mga mamimili ng NTI mismo.

Ang solusyon sa automation?

Upang i-modelo ang istraktura ng pagkonsumo ng kuryente ng isang negosyo, ginagamit ang mga pamamahagi ng ranggo, at para i-modelo ang istruktura ng mga naka-install at naayos na kagamitang elektrikal, ginagamit ang mga uri ng pamamahagi.


Mga pamamahagi ng ranggo. Kasama sa mga pamamahagi ng ranggo ang mga pamamahagi kung saan ang pangunahing tampok ay ang kapasidad ng kuryente ng lahat ng uri ng mga produkto.

Ang pamamahagi ng mga de-koryenteng kapasidad ng lahat ng uri ng mga produkto na ginawa sa isang partikular na negosyo ay tumutukoy sa pamamahagi ng ranggo. Ang parameter ng pamamahagi ng ranggo ay ang koepisyent ng ranggo. Maaari kang makakuha ng mga curve sa pamamahagi ng ranggo at matukoy ang mga koepisyent ng ranggo para sa mga panahon ng pag-uulat (sa quarter, kalahating taon o taon). Kung ang ranking coefficient ay nananatiling pare-pareho sa paglipas ng panahon, nangangahulugan ito na ang istraktura ng mga produkto at ang istraktura ng pagkonsumo ng kuryente ay hindi nagbabago sa paglipas ng panahon. Ang isang pagtaas sa koepisyent ng pagraranggo ay nagpapakita na sa paglipas ng mga taon ang negosyo ay nadagdagan ang iba't ibang mga produkto at ang pagkakaiba sa mga gastos sa enerhiya para sa paggawa ng iba't ibang uri.

Kung para sa bawat uri ng produkto ng isang produksyon ng maraming produkto ay kinakalkula namin ang kapasidad ng kuryente bilang ratio ng taunang pagkonsumo ng kuryente sa dami ng output ng ganitong uri, kung gayon para sa negosyo sa kabuuan ang mga halagang ito ay napapailalim sa pamamahagi ng ranggo. . Ang nakuha na mga parameter ng pamamahagi ng ranggo sa mga nakaraang taon ay may medyo matatag na ugali na tumaas. Ang isang pagtaas sa koepisyent ng pagraranggo ay nagpapakita na ang iba't ibang mga produkto na ginawa sa negosyo at ang pagkakaiba sa mga gastos sa enerhiya para sa paggawa ng iba't ibang uri ay tumataas sa paglipas ng mga taon.

Ang hanay ng mga curve sa pamamahagi ng ranggo ay kumakatawan sa isang ibabaw. Ang pagtatasa ng structural at topological dynamics (trajectory ng paggalaw ng isang indibidwal kasama ang rank distribution curve) sa ibabaw na ito ay nagbibigay ng time series ng electrical capacity ng bawat uri ng produkto na pinag-aaralan, na kung saan ay interesado mula sa punto ng view ng posibilidad. ng pagtataya ng mga parameter ng pagkonsumo ng kuryente. Maaari nating tapusin na mayroong isang malakas na ugnayan sa pagitan ng taunang pagkonsumo ng kuryente ng isang produksyon ng maraming produkto, ang istraktura ng mga produktong gawa at ang iba't ibang mga produkto na ginawa.

Istraktura ng naka-install at naayos na kagamitan. Pamamahagi ng ranggo at species

Aling mga pamamahagi ang inuri bilang pagraranggo

Opsyon 2 (na may higit sa 20 mga pagpipilian). Sa unang yugto, hinati ng respondent ang mga iminungkahing opsyon sa dalawa o tatlong grupo: 1 - angkop, 2 - hindi angkop, ang ikatlong grupo ay maaaring binubuo ng mga opsyon na nahihirapan ang respondent na uriin sa ibang mga grupo. Kung, sa unang pamamahagi, higit sa 10-12 na posisyon ang nananatili sa pangkat na angkop, pagkatapos ay hihilingin sa respondent na hatiin muli ang pangkat na ito ayon sa prinsipyo ng eksaktong angkop - posibleng angkop. Pagkatapos tukuyin ang naaangkop na mga opsyon, ang respondent ay dapat magsagawa ng direktang pagraranggo, pag-uuri ng mga opsyon mula sa pinakamaganda hanggang sa pinakamasama. Alinsunod sa mga resulta ng pagpili, ang mga halaga ng ranggo ay itinalaga sa bawat respondent, mas mabuti sa reverse order (ang pinakamahusay na halaga ay 10, ang susunod ay 9, ang pinakamasama ay 1; na may higit sa 10 halalan, ang huling mga halalan ay itinalaga lahat halaga ng 1.

Tulad ng nabanggit na, ginagamit ang mga tagapagpahiwatig ng ranggo upang makilala ang hugis ng pamamahagi ng isang serye ng variation. Ang ibig sabihin nito ay ang mga unit ng array na pinag-aaralan na sumasakop sa isang partikular na lugar sa serye ng variation (halimbawa, ikasampu, ikadalawampu, atbp.). Ang mga ito ay tinatawag na quantiles o gradients. Ang mga quantiles naman ay nahahati

Bakit ang istatistika ng ranggo (dt) ni Dunn para sa pagsubok ng mga kaibahan (tingnan ang equation (41)) ay nangangailangan ng mga normal na talahanayan ng pamamahagi sa halip na isang -test

Nonparametric na pamamaraan. Ang mga pamamaraang pang-istatistika na hindi parametric, hindi tulad ng mga parametric, ay hindi batay sa anumang mga pagpapalagay tungkol sa mga batas ng pamamahagi ng data3. Ang rank correlation coefficient ng Spearman at ang rank correlation coefficient ni Kendall ay kadalasang ginagamit bilang nonparametric na pamantayan para sa ugnayan ng mga variable.

Ang histogram ay isang graphical na representasyon ng mga istatistikal na distribusyon ng anumang dami ayon sa isang quantitative na katangian. Ito ay maginhawa upang bumuo ng isang histogram (gr. histos - tela) mula sa itaas, pag-plot ng kaukulang mga kadahilanan sa kahabaan ng abscissa axis, at ang kanilang mga rank sums kasama ang ordinate axis. Ang isang histogram ay maaaring magpakita ng mga pagtanggi, ayon sa kung saan ito ay ipinapayong pangkatin ang mga kadahilanan ayon sa antas ng kanilang impluwensya sa tagapagpahiwatig na pinag-aaralan.

Ang ipinakita na mga ideya sa cenological ay maaaring gamitin bilang batayan para sa pagbabago ng organisasyon ng 111 IF system sa isang pang-industriya na negosyo (sa workshop). Sa kasong ito, hindi ang uri ng pamamahagi ng mga naka-install na kagamitang elektrikal ang ginagamit, ngunit ang representasyon ng buong listahan, halimbawa, ng mga de-koryenteng makina sa anyo ng H-distribution na niraranggo ayon sa parameter. Ginagawa ito bilang mga sumusunod. Ang buong hanay ng mga naka-install na makina ay niraranggo ayon sa kanilang kahalagahan (kahalagahan) sa isang teknikal o iba pang proseso. Ang bawat sasakyan ay itinalaga ng sarili nitong ranggo (numero). Ang unang ranggo ay itinalaga sa makina na pinakatutukoy sa proseso ng produksyon. Ang pangalawa ay para sa susunod na pinakamahalagang makina, atbp., upang ang mga huling ranggo ay mapupunta sa mga makina na ang pagkabigo ay hindi nakakaapekto, o sa halip, ay nakakaapekto sa napakaliit, sa produksyon at iba pang mga aktibidad ng negosyo. Ang pagpapatakbo ng pagtatalaga ng ranggo ay hindi nangangailangan ng espesyal na katumpakan, kaya ang isang partikular na makina ay maaaring mapunta sa isang bahagyang naiibang lugar sa isang ibinigay na listahan ng ranggo.

Gamitin natin ang katotohanan ng x2 (12)-distribution ng random variable na m (n - 1) W (m), na nangyayari nang humigit-kumulang) kung walang multiple rank relationship sa populasyon na pinag-aaralan. Pagkatapos ay bumababa ang criterion sa pagsuri sa hindi pagkakapantay-pantay (2.18). Ang pagkakaroon ng itakda ang antas ng kahalagahan ng criterion a = 0.05, makikita natin mula sa talahanayan. A.4 ang halaga ng 5% point ng x2 distribution na may 12 degrees of freedom X OB (12) = 21.026. Kasabay nito, t (n - I) W (t) = - 28-12-0.08 - 27.

Una sa lahat, tandaan muli na ang frequency distribution ay palaging simetriko. Data ng talahanayan Ipinapakita ng 6.9 na, nang naaayon, ang simetrya ng mga frequency ay sumasalamin sa simetrya ng dami ng pagpapasiya ng koepisyent ng ugnayan ng ranggo batay sa mga inversion ng Kinv. Mga koepisyent ng ugnayan ng Spearman (p) at Kendall (T). Naaangkop ang mga pamamaraang ito hindi lamang para sa qualitative, kundi pati na rin para sa quantitative indicators, lalo na sa maliit na laki ng populasyon, dahil ang mga non-parametric rank correlation na pamamaraan ay hindi nauugnay sa anumang mga paghihigpit patungkol sa likas na katangian ng pamamahagi ng katangian.

Matapos makuha ang isang pagkakasunud-sunod ng mga pamamahagi ft (P), ang gawain ay lumitaw sa pag-aaral ng proseso ng paglipat sa pagitan nila, i.e. kadaliang mapakilos ng mga rehiyon ayon sa mga presyo. Tulad ng nabanggit sa pagsusuri ni Fields, Ok (2001), ang konsepto ng mobility mismo ay hindi malinaw na tinukoy; ang literatura sa mobility ay hindi nagbibigay ng pinag-isang paglalarawan ng pagsusuri (at walang itinatag na terminolohiya). Gayunpaman, mayroong kasunduan sa pang-ekonomiya at sosyolohikal na panitikan tungkol sa dalawang pangunahing konsepto ng kadaliang kumilos. Ang una ay relatibong (o ranggo) na kadaliang nauugnay sa mga pagbabago sa pag-order, sa aming kaso, ng mga rehiyon ayon sa antas ng presyo. Ang pangalawang konsepto ay absolute (o quantitative) mobility, na nauugnay sa mga pagbabago sa mismong mga antas ng presyo sa mga rehiyon. Sa sumusunod na pagsusuri, ang parehong mga konseptong ito ay ginagamit.

Iba pang mga pamamaraan. Isinasaalang-alang namin ang isang pamamaraan batay sa mga istatistika ng ranggo ng Steele para sa mga paghahambing ng mga eksperimental at kontrol na paraan na tinalakay kanina. Ang alternatibong pamamaraang ito ay ipinapalagay din ang stochastically ordered distributions. Para sa klase ng mga distribution na ito ang pamamaraan ay hindi gaanong mahusay; ito ay mas epektibo para sa espesyal na kaso ng mga distribution na naiiba lamang ang shift (tingnan

Ang sequential rank method ng Hole na may pag-aalis para sa stochastically ordered distributions. Ang mga stochastically ordered distribution ay sumasaklaw sa mga distribusyon na nagkakaiba lamang ayon sa shift, ngunit hindi sa mga normal na distribution na may iba't ibang variance. Hindi namin alam kung ang pamamaraan ay sensitibo sa mga paglihis mula sa stochastic order assumption.

Pagpaplano at pagsasagawa ng mga eksperimento upang matukoy ang mga parameter ng mga pag-atake sa network

Sa susunod na yugto ng pagsusuri sa modelo ng trapiko, kinakailangan upang malaman kung ang modelong ito ay maaaring ilapat sa mga gawain sa seguridad ng network, sa partikular, upang makita ang mga pag-atake sa network.

Upang malaman ang mga detalye ng hindi awtorisadong panghihimasok, napagpasyahan na magsagawa ng mga eksperimento na gayahin ang mga pagtatangkang pag-atake. Isinagawa ang mga ito sa network ng Samara State Aerospace University (SSAU).

Ginamit ang malayuang data bilang pinagmulan ng pag-atake. mga personal na computer, konektado sa Internet, na matatagpuan sa isang panlabas na network na may kaugnayan sa pinag-aaralan. Ang target ng pag-atake ay isa sa mga panloob na server ng SSAU network. Ang border router ng SSAU Cisco 6509 network ay pinili bilang isang NetFlow sensor, at ang NetFlow collector ay ang parehong server na inatake.

Isang computer lamang ang kasangkot sa pag-scan, dahil ang pag-atake sa pag-scan sa port ay isinasagawa mula sa mga iisang mapagkukunan. Para sa pag-scan, ginamit ang Nmap program, na inutusang magsagawa ng buong pag-scan ng lahat ng port ng inatakeng server.

Ang Nmap ay isang libreng utility na idinisenyo para sa iba't ibang pasadyang pag-scan ng mga IP network na may anumang bilang ng mga bagay, na tinutukoy ang estado ng mga bagay ng na-scan na network (mga port at ang kanilang mga kaukulang serbisyo). Ang Nmap ay gumagamit ng marami iba't ibang pamamaraan mga pag-scan gaya ng UDP, TCP (kunekta), TCP SYN (half-open), FTP proxy (ftp breakthrough), Reverse-ident, ICMP (ping), FIN, ACK, Xmas tree, SYN at NULL scan.

Kapag nagsasagawa ng pag-atake ng DDoS, ang parehong web server ay pinili bilang ang inaatakeng target tulad ng sa panahon ng pag-scan. Ang mga pinagmulan ng pag-atake ay ilang mga computer na matatagpuan sa isang panlabas na network. Sa unang bahagi ng eksperimento, ang mga umaatake na computer ay sabay-sabay na nagpadala ng mga kahilingan sa ping sa loob ng kalahating oras, na nagsasagawa ng ICMP flood attack. Sa ikalawang bahagi ng eksperimento, ang umaatake na mga computer ay nagsagawa ng pag-atake ng DDoS gamit ang isang espesyal na programang LOIC. Sa loob ng isang oras, inatake ang web server gamit ang iba't ibang uri trapiko: HTTP, UDP, TCP. Sa lahat ng mga eksperimento, nakolekta ang data, na kasunod na sinuri upang matukoy ang mga pattern iba't ibang uri mga pag-atake.

Figure 1.16 – Eksperimento scheme

Ang daloy ng data na nagsisilbing batayan para sa pagsusuri ay nakolekta mula sa isang Cisco 6509 network edge router. Ang nfdump NetFlow collector ay ginamit upang mangolekta ng data mula sa router. Ang data ng NetFlow ay ini-export para sa pagsusuri bawat limang minuto. Bawat limang minuto, may nabuong file na nagsasaad ng mga parameter ng lahat ng daloy na naitala sa router sa oras na iyon. Ang mga parameter na ito ay nakalista sa panimula at kasama ang: oras ng pagsisimula ng stream, tagal ng stream, protocol ng paglilipat ng data, address at port ng pinagmulan, address at port ng patutunguhan, bilang ng mga packet na ipinadala, bilang ng data na ipinadala sa mga byte.

Bilang resulta ng pagsusuri sa data na nakolekta sa panahon ng pag-scan ng network, ang isang matalim na pagtaas sa bilang ng mga aktibong daloy ay ipinahayag na may halos pare-parehong dami ng ipinadalang trapiko (tingnan ang Fig. 1.16). Ang bawat scanning computer ay nakabuo ng humigit-kumulang 10-20 libong napakaikling stream (hanggang sa 50 bytes ang laki) sa loob ng 5 minuto. Kasabay nito, ang kabuuang bilang ng mga aktibong stream sa router, na nabuo ng lahat ng mga gumagamit, ay humigit-kumulang 50-60 libo.

Ipinapakita ng Figure 1.17 ang isang graph ng estado ng network, ang bilang ng mga nakumpletong daloy N ay naka-plot sa abscissa axis, at ang kabuuang channel load sa Megabits bawat segundo (Mbit/s) ay naka-plot sa ordinate axis. Ang bawat punto sa graph ay sumasalamin sa estado ng network na pinag-aaralan para sa nakaraang limang minutong agwat, na nagpapakita ng pag-asa ng average na pag-load ng channel sa bilang ng mga aktibong daloy. Ang mga tuldok ay tumutugma sa mga normal na estado ng network, at ang mga tatsulok ay tumutugma sa mga estado ng network na naitala sa panahon ng pag-scan ng port. Ang mga segment na ipinapakita sa graph at parallel sa ordinate axis ay nagpapakita ng mga confidence interval para sa average na load na kinakalkula para sa limang flow interval (20000-30000, 30000-40000, 40000-50000, 50000-60000, 60000-70000, 60000-70000).


Larawan 1.17 – Pag-scan sa port

Batay sa mga resulta ng eksperimento sa mga kahilingan sa ping, nalaman na ang bawat umaatakeng computer ay nakatanggap lamang ng isang napakahabang stream ng trapiko ng ICMP kung ang mga kahilingan ay ipinadala sa isang port. Dahil ang data tungkol sa isang daloy ay isinulat lamang sa pagkumpleto nito, ang kinakailangang data ay isinulat sa nfdump file pagkatapos makumpleto ang pag-atake. Isang abnormal na mahabang daloy ng trapiko ng ICMP ang nakita; ang pinagmulan ay ang umaatakeng computer. Kaya, bilang isang resulta ng pagsusuri ng pang-eksperimentong data, posibleng matukoy ang isang pag-atake ng uri ng baha ng ICMP. Dapat pansinin na upang makamit ang resulta - mga malfunctions sistema ng impormasyon Ang isang aktibong daloy ng trapiko ng ICMP ay malinaw na hindi sapat; dapat mayroong libu-libong mga kahilingan.

Pagsusuri ng Simulation Experiment Pag-atake ng DDoS Ang LOIC utility ay nagpakita rin ng isang matalim na pagtaas sa bilang ng mga aktibong thread kasama ng pagtaas sa ipinadalang trapiko. Ang utility ay nagpapadala ng data na kahanay sa iba't ibang mga target na port, sa gayon ay lumilikha malaking bilang ng maikling stream na tumatagal ng hanggang isang minuto (tingnan ang Fig. 1.18). Inilalarawan ng mga tatsulok ang mga estado ng network na naitala sa panahon ng pag-atake.


Larawan 1.18 – Pag-atake ng DDoS

Kaya, naging malinaw na ang paggamit ng NetFlow protocol ay posible na makilala hindi lamang sa sandaling nagsimula ang pag-atake, ngunit matukoy din ang uri nito. Detalyadong Paglalarawan Ang mga algorithm sa pag-detect ng pag-atake at paggawa ng secure na pagho-host ay makikita sa mga sumusunod na seksyon.

Panitikan

1. Bolla R., Bruschi R. RFC 2544 performance evaluation at internal measurements para sa Linux based open router //High Performance Switching and Routing, 2006 Workshop on. – IEEE, 2006. – P. 6 pp.

2. Fraleigh C. et al. Mga sukat ng trapiko sa antas ng packet mula sa Sprint IP backbone //IEEE network. – 2003. – T. 17. – Hindi. 6. – pp. 6-16.

3. Park K., Kim G., Crovella M. Sa ugnayan sa pagitan ng mga laki ng file, transport protocol, at self-similar network traffic //Network Protocols, 1996. Proceedings., 1996 International Conference on. – IEEE, 1996. – pp. 171-180.

4. Fred S. B. et al. Pagbabahagi ng bandwidth ng istatistika: isang pag-aaral ng kasikipan sa antas ng daloy //ACM SIGCOMM Computer Communication Review. – ACM, 2001. – T. 31. – Hindi. 4. – pp. 111-122.

5. Barakat C. et al. Isang flow-based na modelo para sa internet backbone traffic //Proceedings of the 2nd ACM SIGCOMM Workshop on Internet measurement. – ACM, 2002. – pp. 35-47.

6. Sukhov A. M. et al. Mga aktibong daloy sa diagnostic ng pag-troubleshoot sa mga backbone link //Journal of High Speed ​​​​Networks. – 2011. – T. 18. – Hindi. 1. – pp. 69-81.

7. Lyon G. F. Nmap network scanning: Ang opisyal na gabay sa proyekto ng Nmap sa pagtuklas ng network at pag-scan ng seguridad. – Insecure, 2009.

8. Haag P. Panoorin ang iyong Daloy kasama ang NfSen at NFDUMP //50th RIPE Meeting. – 2005.

Mga pamamahagi ng ranggo para sa pagtukoy ng mga halaga ng threshold ng mga variable ng network at pagsusuri sa mga pag-atake ng DDoS

Panimula

Ang exponential na paglago ng trapiko sa Internet at ang bilang ng mga mapagkukunan ng impormasyon ay sinamahan ng mabilis na pagtaas sa bilang ng mga maanomalyang kundisyon ng network. Ang mga maanomalyang kundisyon ng network ay ipinaliwanag ng parehong gawa ng tao at mga kadahilanan ng tao. Ang pagkilala sa mga maanomalyang estado na nilikha ng mga umaatake ay medyo mahirap dahil sa katotohanan na ginagaya nila ang mga aksyon ordinaryong gumagamit. Samakatuwid, ang mga maanomalyang kundisyon ay napakahirap kilalanin at harangan. Ang mga gawain ng pagtiyak sa pagiging maaasahan at seguridad ng mga serbisyo sa Internet ay nangangailangan ng pag-aaral ng gawi ng user sa isang partikular na mapagkukunan.

Tatalakayin ng artikulong ito ang pagtukoy ng mga maanomalyang kundisyon ng network at mga paraan ng pagkontra sa mga pag-atake ng DDoS. (Distributed Denial of Service, distributed denial of service attack) ay isang uri ng pag-atake kung saan ang isang bilang ng mga computer sa Internet, na tinatawag na "zombies", "bots" o isang bot network (botnet), sa utos ng attacker ay nagsimulang magpadala mga kahilingan para sa serbisyo mula sa biktima. Kapag ang bilang ng mga kahilingan ay lumampas sa kapasidad ng mga server ng biktima, ang mga bagong kahilingan mula sa mga tunay na user ay hindi na sineserbisyuhan at nagiging hindi magagamit. Sa kasong ito, ang biktima ay dumaranas ng mga pagkalugi sa pananalapi.

Ang mga pag-aaral na inilarawan sa kabanatang ito ng aklat-aralin ay gumagamit ng isang pinag-isang diskarte sa matematika. Natukoy ang ilan sa pinakamahalagang variable ng network, na nabuo ng isang panlabas na solong IP address kapag nag-a-access sa isang ibinigay na server o lokal na network. Kabilang sa mga naturang variable ang: ang dalas ng pag-access sa web server (sa isang naibigay na port), ang bilang ng mga aktibong thread, ang dami ng papasok na TCP, UDP at ICMP na trapiko, atbp. Ang binuo na imprastraktura ay naging posible upang masukat ang mga halaga para sa mga variable ng network sa itaas.

Matapos mahanap ang mga halagang ito para sa nasuri na mga variable sa isang di-makatwirang punto ng oras, kinakailangan na bumuo ng isang pamamahagi ng ranggo. Upang gawin ito, ang mga nahanap na halaga ay nakaayos sa pababang pagkakasunud-sunod. Ang pagsusuri ng mga estado ng network ay isasagawa sa pamamagitan ng paghahambing ng mga kaukulang distribusyon. Ang paghahambing na ito ay lalong malinaw kapag ang mga distribusyon para sa maanomalyang at normal na estado ng network ay naka-plot sa parehong graph. Pinapadali ng diskarteng ito na matukoy ang hangganan sa pagitan ng normal at maanomalyang estado ng network.

Ang mga eksperimento sa isang pag-atake ng DDoS sa isang serbisyo ay maaaring isagawa gamit ang pagtulad sa mga kondisyon ng laboratoryo. Kasabay nito, ang halaga ng mga resulta na nakuha ay makabuluhang mas mababa kaysa sa panahon ng pag-atake ng DDoS sa isang komersyal na serbisyo na inilagay sa operasyon, dahil ang emulator ay hindi maaaring ganap na magparami ng isang tunay na network ng computer. Bilang karagdagan, upang lubos na maunawaan ang mga prinsipyo at pamamaraan ng pag-atake ng DDoS, kailangan ang karanasan dito. Samakatuwid, ang mga may-akda ay hindi nagpapakilalang sumang-ayon na magsagawa ng isang tunay na pag-atake ng DDoS sa isang espesyal na inihandang serbisyo sa web. Sa panahon ng pag-atake, naitala ang trapiko sa network at nakolekta ang mga istatistika ng NetFlow. Pag-aaral ng mga pamamahagi ng ranggo para sa bilang ng mga daloy at iba't ibang uri ng papasok na trapiko na nabuo ng isang panlabas na IP address, na naging posible upang matukoy ang mga halaga ng threshold. Ang paglampas sa mga halaga ng threshold ay maaaring maiuri bilang isang tanda ng isang umaatake na node, na nagbibigay-daan sa amin upang makagawa ng mga konklusyon tungkol sa pagiging epektibo ng mga pamamaraan ng pagtuklas at mga kontra-hakbang.

1

1. Kudrin B.I. Panimula sa teknolohiya. – 2nd ed., binago, karagdagang. – Tomsk: TSU, 1993. – 552 p.

2. Matematika na paglalarawan ng mga cenoses at mga batas ng teknolohiya. Pilosopiya at ang pagbuo ng teknolohiya / ed. B.I. Kudrina // Cenological studies. – Vol. 1-2. – Abakan: Center for System Research, 1996. – 452 p.

3. Gnatyuk V.I. Ang batas ng pinakamainam na pagtatayo ng mga technocenoses: monograph. – Isyu 29. Cenological research. – M.: TSU Publishing House – Center for System Research, 2005. – 452 p. (http://www.baltnet.ru/~gnatukvi/ind.html).

4. Gurina R.V. Pagsusuri ng ranggo ng mga sistemang pang-edukasyon (cenological approach): mga alituntunin para sa mga tagapagturo. – Isyu 32. "Cenological Research". – M.: Tekhnetika, 2006. – 40 p. (http://www.gurinarv.ulsu.ru).

5. Gurina R.V., Dyatlova M.V., Khaibullov R.A. Pagsusuri ng ranggo ng mga astrophysical at pisikal na sistema // Kazan Science. – 2010. – No. 2. – P. 8-11.

6. Gurina R.V., Lanin A.A. Mga limitasyon ng kakayahang magamit ng batas ng pamamahagi ng ranggo // Technogenic self-organization at mathematical apparatus ng cenological research. – Vol. 28. “Cenological studies.” – M.: Center for System Research, 2005. –P. 429-437.

7. Khaibullov R.A. Pagsusuri ng ranggo ng mga sistema ng espasyo // Balita ng State Administrative District sa Pulkovo. Mga pamamaraan ng pangalawang kumperensya ng kabataan sa Pulkovo. – St. Petersburg, 2009. – No. 219. – Isyu. 3. – pp. 95-105.

8. Uchaikin M.V. Application ng batas ng pamamahagi ng ranggo sa mga bagay ng Solar system // Balita ng State Administrative District sa Pulkovo. Mga pamamaraan ng pangalawang kumperensya ng kabataan sa Pulkovo. – St. Petersburg, 2009. – No. 219. – Isyu. 3. – pp. 87-95.

Ang pamamahagi ng ranggo (RD) ay nauunawaan bilang isang pamamahagi na nakuha bilang isang resulta ng pamamaraan ng pagraranggo ng isang pagkakasunud-sunod ng mga halaga ng parameter na itinalaga ayon sa ranggo. Ang ranggo r ay ang bilang ng isang indibidwal sa pagkakasunud-sunod sa RR. Ang pagraranggo ay isang pamamaraan para sa pag-aayos ng mga bagay ayon sa antas ng pagpapahayag ng isang kalidad sa pababang pagkakasunud-sunod ng kalidad na ito. Ang tunay na RR ay maaaring ipahayag ng iba't ibang mga dependency sa matematika at may kaukulang graphical na hitsura, gayunpaman, ang pinakamahalaga ay hyperbolic rank distributions (HRD), dahil sinasalamin nila ang tanda ng "cenosis" - ang pag-aari ng hanay ng mga ranggo na bagay (mga elemento, indibidwal) sa mga cenoses. Ang teorya ng cenoses na may kaugnayan sa mga teknikal na produkto ay binuo ng MPEI professor B.I. Kudrin higit sa 30 taon na ang nakaraan (www kudrinbi.ru) at matagumpay na ipinakilala sa pagsasanay. Ang mga pamamaraan para sa pagbuo ng geological exploration at ang kanilang kasunod na paggamit upang ma-optimize ang cenosis ay bumubuo sa pangunahing kahulugan ng rank analysis (RA) (cenological approach), ang nilalaman at teknolohiya na kumakatawan sa isang bagong direksyon na nangangako ng mahusay na praktikal na mga resulta. Ang batas ng hyperbolic rank distribution ng mga indibidwal sa isang technocenosis (H-distribution) ay may anyo:

W = A / r β (1)

kung saan ang W ay ang ranggo na parameter ng mga indibidwal; r - ranggo na numero ng indibidwal (1,2,3....); Ang A ay ang pinakamataas na halaga ng parameter ng pinakamahusay na indibidwal na may ranggo r = 1, i.e. sa unang punto; β - rank coefficient na nagpapakilala sa antas ng steepness ng PP curve (para sa technocenoses 0.5< β < 1,5 ).

Kung niraranggo ang anumang parameter ng cenosis, ang PP ay tinatawag na ranking parametric. Ang pagpapailalim ng isang komunidad ng mga indibidwal sa batas ng geological development (1) ay ang pangunahing tanda ng isang cenosis, ngunit ito ay hindi sapat. Bilang karagdagan sa tampok na ito, ang mga cenoses, hindi tulad ng ibang mga komunidad, ay mayroon pangkalahatang kapaligiran tirahan, at ang mga bagay nito ay kasama sa pakikibaka para sa mga mapagkukunan.

SA AT. Binuo ni Gnatyuk ang paraan ng RA para sa pag-optimize ng mga teknikal na sistema ng cenosis. Ang mga posibilidad ng praktikal na paggamit ng RA sa pedagogy ay inilarawan ni R.V. Gurina (http://www.gurinarv.ulsu.ru), at bumuo din ng isang pamamaraan para sa aplikasyon nito sa lugar na ito. Tinutukoy ng bilang ng mga indibidwal sa cenosis ang kapangyarihan ng populasyon. Ang terminolohiya ay nagmula sa biology, mula sa teorya ng biocenoses. Ang "Cenosis" ay isang komunidad. Ang terminong biocenosis, na ipinakilala ni Mobius (1877), ay naging batayan ng ekolohiya bilang isang agham. B.I. Inilipat ni Kudrin ang mga konsepto ng "cenosis", "indibidwal", "populasyon", "species" mula sa biology hanggang sa teknolohiya: sa teknolohiya ang "mga indibidwal" ay mga indibidwal na teknikal na produkto, teknikal na mga detalye, at isang malaking hanay ng mga teknikal na produkto (mga indibidwal), ang RR kung saan ay ipinahayag ng batas (1) ay tinatawag na technocenosis.

SA panlipunang globo Ang "mga indibidwal" ay mga taong nakaayos sa mga pangkat ng lipunan (mga klase, mga grupo ng pag-aaral), kung gayon ang kapangyarihan ng populasyon ay ang bilang ng mga mag-aaral sa grupo. Ang isang paaralan ay isa ring sociocenosis, na binubuo ng mga indibidwal - indibidwal na istrukturang yunit - mga klase. Dito ang population power ay ang bilang ng mga klase sa paaralan. Ang isang set ng mga paaralan ay isang cenosis ng mas malaking sukat, kung saan ang indibidwal, istrukturang yunit ng cenosis na ito ay ang paaralan. Ang mga parameter ng ranking na W sa mga technocenoses ay mga teknikal o pisikal na parameter na nagpapakilala sa isang indibidwal, halimbawa, laki, timbang, paggamit ng kuryente, enerhiya ng radiation, atbp. Sa sociocenoses, sa partikular na pedagogical cenoses, ang mga ranggo na parameter ay akademikong pagganap, ang rating sa mga puntos ng mga kalahok sa olympiads o pagsubok; ang bilang ng mga estudyanteng natanggap sa mga unibersidad, at iba pa, at ang mga indibidwal na niraranggo ay ang mga mag-aaral mismo, mga klase, mga grupo ng pag-aaral, mga paaralan, at iba pa.

Ipinakita ng pananaliksik sa mga nakaraang taon na ang mga koleksyon ng mga bagay sa kalawakan ng maraming sistema (mga kalawakan, solar system, mga kumpol ng mga kalawakan, atbp.) ay kumakatawan sa mga cenoses (cosmocenoses, astrocenoses). Gayunpaman, ang mga astrocenoses ay naiiba sa mga tenocenoses at sociocenoses dahil hindi maimpluwensyahan ng isang tao ang kanilang estado, baguhin at i-optimize ang mga ito. Sa kalawakan, ang mga bagay ay mahigpit na konektado sa isa't isa sa pamamagitan ng mga puwersa ng gravitational na tumutukoy sa kanilang pag-uugali. Ang mga detalye ng mga astrocenoses ay hindi pa ganap na naipaliwanag; ang pamamaraan ng RA na may kaugnayan sa mga astrocenoses ay hindi pa nabuo, na tumutukoy sa layunin ng pag-aaral na ito. Ang layunin ay nahahati sa isang bilang ng mga gawain:

1. Pag-aaral ng pamamaraan ng RA, pagtukoy sa posibilidad ng pagiging angkop ng pamamaraang RA sa mga astrophysical system-cenoses (ibig sabihin, hanggang saan ang RA ay naaangkop sa mga astrocenoses).

2. Hakbang-hakbang na paglalarawan aplikasyon ng pamamaraang RA para sa mga astrocenoses.

Matapos pag-aralan ang pamamaraan para sa paggamit ng RA para sa mga technocenoses, natukoy ang mga karaniwang (unibersal) na elemento nito, na naaangkop sa lahat ng uri ng cenoses. Kaya, kasama sa pamamaraan ng RA ang mga sumusunod na hakbang sa pangkalahatang pamamaraan.

1. Pagkilala sa isang cenosis - isang hanay ng mga bagay ng komunidad (sistema) na pinag-aaralan.

2. Pagkilala sa mga parameter ng pagraranggo. Ang nasabing mga parameter ay maaaring ang masa, laki ng mga bagay, gastos, pagiging maaasahan ng enerhiya, porsyento ng mga elemento sa komposisyon ng bagay na pinag-aaralan, mga marka ng Unified State Exam ng mga kalahok sa pagsusulit, atbp.

3. Parametric na paglalarawan ng cenosis. Paglikha ng isang spreadsheet (database) na naglalaman ng sistematikong impormasyon tungkol sa mga parameter ng mga indibidwal na indibidwal ng cenosis.

4. Pagbuo ng isang tabulated empirical RR. Ang naka-tabulate na RR ay isang talahanayan ng dalawang column: mga parameter ng mga indibidwal na nakaayos ayon sa ranggo at ang numero ng ranggo ng indibidwal na r (r = 1,2,3...). Ang unang ranggo ay inookupahan ng indibidwal na may pinakamataas na halaga ng parameter, ang pangalawang ranggo ay inookupahan ng indibidwal na may pinakamataas na halaga ng parameter sa iba pang mga indibidwal, atbp.

5. Pagbuo ng isang graphical empirical RR. Ang graph ng empirical ranking curve ay may anyo ng hyperbola: ang rank number r ay naka-plot kasama ang abscissa axis, at ang pinag-aralan na parameter na W ay naka-plot kasama ang ordinate axis, Fig. 1, a. Ang lahat ng data ay kinuha mula sa naka-tabulate na RR.

kanin. 1. Hyperbola (a) at "itinuwid" na hyperbolic dependence sa double logarithmic scale (b); B = lnA

6. Approximation ng empirical RR. Ang pagtatantya at pagpapasiya ng mga parameter ng PP ay karaniwang isinasagawa gamit ang mga programa sa computer, sa kanilang tulong ay itinakda ang isang agwat ng kumpiyansa, ang mga parameter ng curve ng pamamahagi A at B ay matatagpuan, at ang koepisyent ng regression Re (o Re2) ay tinutukoy din, na nagpapakita ng antas ng approximation ng empirical hyperbola sa theoretical one. Sa kasong ito, ang isang approximation ideal curve ay iguguhit (at, kung kinakailangan, sa magkabilang panig nito - mga linya ng agwat ng kumpiyansa).

7. Linearization ng GR: pagbuo ng isang empirical RR sa logarithmic coordinate. Ipaliwanag natin ang proseso ng linearization ng dependence (1). Ang pagkuha ng logarithm ng pagtitiwala (1) W = A / r β, makuha namin ang:

lnW = lnA - β ln r (2)

pagtatalaga:

lnW = y; lnA = B = const; ln r = x, (3)

nakukuha namin ang (2) sa anyo:

y = B - β x. (4)

Ang equation (4) ay isang nagpapababang linear function (Fig. 1, b). Ang lnW lamang ang naka-plot sa kahabaan ng ordinate axis, at ang lnr ay naka-plot sa kahabaan ng abscissa axis. Upang makabuo ng isang linear graph, isang talahanayan ng mga empirical na halaga ng lnW at lnr ay pinagsama-sama, batay sa mga halaga kung saan ang isang graph ng dependence lnW(lnr) ay binuo gamit ang mga programa sa computer.

Ang manu-manong coefficient β ay tinutukoy ng formula:

β = tan α = lnA: ln r ,

Ang koepisyent A ay tinutukoy mula sa kundisyon: r = 1, W1= A.

8. Approximation ng empirical dependence ln W (lnr) sa linear one Y = B - β x.

Ang pamamaraang ito ay isinasagawa din gamit ang mga programa sa kompyuter; Sinusundan ito ng paghahanap ng mga parameter β, A, pagtukoy sa pagitan ng kumpiyansa, pagtukoy sa koepisyent ng regression Re (o Re 2), pagpapahayag ng antas ng pagtatantya ng empirical graph ln W (ln r) sa isang linear na anyo. Sa kasong ito, lilitaw ang isang tinatayang tuwid na linya.

9. Pag-optimize ng cenosis (para sa bio, - techno, - sociocenoses).

Ang pamamaraan para sa pag-optimize ng isang sistema (cenosis) ay binubuo ng pagtatrabaho kasama ng mga naka-tabulated at graphical na mga pamamahagi at paghahambing ng perpektong kurba sa tunay, pagkatapos kung saan ang isang konklusyon ay iguguhit: kung ano ang praktikal na kailangang gawin sa cenosis upang ang mga punto ng ang tunay na kurba ay may posibilidad na nasa perpektong kurba. Ang mas malapit ang empirical distribution curve ay lumalapit sa ideal na curve ng uri (1), mas matatag ang system. Kasama sa yugto ng pag-optimize ang mga sumusunod na pamamaraan (mga aksyon).

Teoretikal na bahagi: magkasanib na gawain na may tabulated at graphical na PP:

Paghahanap ng mga maanomalyang punto at pagbaluktot sa graph;

Pagpapasiya ng kanilang mga coordinate at ang kanilang pagkakakilanlan sa mga tunay na indibidwal ayon sa naka-tabulate na pamamahagi;

Praktikal na bahagi: nagtatrabaho sa mga tunay na bagay ng cenosis upang mapabuti ito:

Pagsusuri ng mga sanhi ng mga anomalya at paghahanap ng mga paraan upang maalis ang mga ito (managerial, pang-ekonomiya, produksyon, atbp.);

Pag-aalis ng mga anomalya sa isang tunay na cenosis.

Pag-optimize ng mga technocenoses ayon sa V.I. Ang Gnatyuk ay isinasagawa sa dalawang paraan:

1. Nomenclature optimization - isang naka-target na pagbabago sa populasyon ng isang cenosis, na nagdidirekta sa tunay na RR sa anyo sa ideal (1). Sa isang flock biocenosis, ito ay ang pagpapatalsik o pagsira sa mga mahihinang indibidwal, sa grupo sa pag-aaral Ito ang screening sa mga underachievers, sa technocenosis - pag-alis ng basura, pag-convert ng mga gamit na kagamitan sa kategorya ng scrap metal.

2. Parametric optimization - naka-target na pagpapabuti ng mga parameter ng mga indibidwal na indibidwal, na humahantong sa cenosis sa isang mas matatag, mahusay na estado. Sa isang pedagogical cenosis - isang pangkat na pang-edukasyon (klase) - ito ay nagtatrabaho sa mga underachievers - pagpapabuti ng kanilang mga tagapagpahiwatig ng pagganap; sa isang technocenosis - pinapalitan ang mga lumang kagamitan na may pinahusay na mga modelo.

Tulad ng nakasaad sa itaas, ang pamamaraan ng pag-optimize 9 ay hindi naaangkop sa mga astrocenoses. Sa pamamagitan ng pag-aaral ng kanilang paggalugad sa geological, maaari lamang kunin ng isa ang isa o isa pang kapaki-pakinabang na pang-agham na impormasyon tungkol sa estado ng astrocenosis, sa gayon ay nagpapalawak ng pag-unawa sa astronomikal na larawan ng Mundo. Ano ang likas na katangian ng mga paglihis sa totoong geological na paggalugad ng mga bagay ng astrophysical cenoses mula sa perpektong pamamahagi ng H at ano ang ipinahihiwatig ng mga ito? Dalawang uri ng distortion ang nakita sa mga geological exploration graph ng mga bagay sa astrocenosis system:

I. Maraming puntos ang nahuhulog sa pagitan ng kumpiyansa ng GRR o ang hyperbola ay nasira (ang pagkakaroon ng "humps", "lambak", "mga buntot" (Larawan 2, a).

II. Isang matalim na break sa logarithmic straight line lnW (lnr), na hinahati ito sa 2 segment (sa isang anggulo sa isa't isa o may shift kasama ang y-axis).

Sa Fig. 2, a, b - RR graphs ng Satup satellite na may mga distortion ng unang uri.

Dahil sa di-kasakdalan ng teknolohiya sa pagsukat o mga pamamaraan ng astronomical measurements, sa lahat ng 62 satellite ng Saturn, mayroong impormasyon tungkol sa masa ng 19 satellite at ang diameter ng 45 satellite. Malinaw na nakikita mula sa mga graph na sa isang sistema na may malaking bilang ng mga indibidwal (Larawan 2, b), ang mga empirical point na sumasalamin sa mga sukat ng mga satellite ay mas angkop sa logarithmic straight line, na nagpapahiwatig ng mas sapat na impormasyon tungkol sa pagkakumpleto. ng sistema. Ang nasa itaas ay nagpapahintulot sa amin na igiit na ang paggamit ng RA ay ginagawang posible upang mahulaan ang pagkakaroon ng mga nawawalang bagay sa mga sistema ng kalawakan.

kanin. 2. Pamamahagi ng ranggo ng mga satellite ng Saturn sa double logarithmic scale ln W = f(ln r); r - numero ng ranggo ng satellite; a) RR 19 satellite batay sa mga kilalang masa; b) Mga RR satellite sa parehong sistema na may malaking bilang ng mga indibidwal - 45 satellite ng mga kilalang diameter

Kapag nag-aaral ng mga graphical na RR astrocenoses, natagpuan na ang unang uri ng pagbaluktot ay maaaring magpahiwatig na:

Ang ilang mga bagay ay hindi kabilang sa astrocenosis na ito (sistema, klase);

Ang mga sukat ng mga parameter ng mga bagay ng astrocenosis ay hindi tumpak;

Walang sapat na impormasyon tungkol sa pagkakumpleto ng astrophysical system-cenosis. Kasabay nito, kaysa mas kumpletong sistema, mas malaki ang regression coefficient.

Ang pangalawang uri ng pagbaluktot ay nagpapahiwatig ng sumusunod.

Kung mayroong matinding break sa graph ng pagwawasto, nangangahulugan ito na ang system ay binubuo ng dalawang subsystem. Ang isang katulad na kaso ay kinakatawan ng mga graph sa Fig. 3, 4. Kasabay nito, sa graph W (r) isang matalim na pahinga ay nabuo sa pamamagitan ng dalawang hyperbolas "gumagapang sa ibabaw ng bawat isa" (Larawan 3, a), at ang break na ito ay hindi palaging binibigkas tulad ng sa ang graph sa double logarithmic scale (Fig.3 b, 4, b). Kung mas maliit ang anggulo sa pagitan ng mga linearized na segment sa ln W (ln r) graph, mas malinaw ang hyperbola bend sa W (r) graph.

Sa Fig. Ang 3, a, b ay nagpapakita ng mga graph ng geometric distribution ng mga kilalang galaxy ayon sa distansya mula sa ating Solar System (40 objects sa kabuuan).

Kung mayroong matinding break sa graph ng pagwawasto, nangangahulugan ito na ang system ay binubuo ng dalawang subsystem. Ginagawang posible ng RA na teoretikal na hatiin ang sistema ng kalawakan sa dalawang klase: ang peripheral (remote) na pangkat -1 at ang lokal (kalapit) na pangkat ng mga kalawakan - 2, na tumutugma sa data ng pag-uuri ng astronomya.

kanin. 3. Pamamahagi ng ranggo ng mga kalawakan ayon sa distansya mula sa Solar System, kung saan ang 1 ay ang peripheral na grupo ng mga kalawakan, na may Re=0.97; 2 - lokal na pangkat ng mga kalawakan, Re=0.86; W ay ang distansya ng Galaxy, kpc; r ay ang ranggo na numero ng kalawakan. Mayroong 40 mga bagay sa kabuuan. a) Graph W(r), Re=0.97; b) Graph ln W= f(ln r), Re=0.86

kanin. 4. PP masa ng mga planeta ng Solar system (sa Earth mass), kung saan ang pangkat 1 - higanteng mga planeta (Jupiter, Saturn, Uranus, Neptune); 2 - terrestrial na mga planeta; Ang W ay ang masa ng planeta, M; r - ranggo na numero ng planeta. Mayroong 8 mga bagay sa kabuuan; a) Graph W(r), Re= 0.99; b) Graph ln W= f(ln r), para sa 1 - (mga higanteng planeta) Re = 0.86, para sa 2 din - Re = 0.86

Tulad ng alam mo mula sa kursong astronomiya, ang ating planetary system ay may 2 subsystem: higanteng planeta at terrestrial na planeta. Sa Fig. Ang 4, a, b ay nagpapakita ng geometric na distribusyon ng mga planeta ng Solar system ayon sa masa. Tandaan na direkta sa hyperbolic RRs ang mga kinks ay maaaring hindi malinaw na nakikita, at imposibleng makilala ang mga subsystem sa mga ito (Fig. 4, a), samakatuwid ito ay kinakailangan upang bumuo ng mga RR sa isang double logarithmic scale, kung saan ang mga kink ay malinaw. ipinahayag (Larawan 4, b).

Paggamit ng mga sangguniang aklat pisikal na dami at Internet resource, geological exploration ng iba pang astrocenoses ay itinayo, na nagpapatunay sa itaas. Ang approximation ay isinagawa gamit ang QtiPlot program.

kaya:

Ang pamamaraan ng RA para sa mga sistema ng cenosis ay isinasaalang-alang at inilarawan nang sunud-sunod ayon sa pagkakatulad sa mga technocenoses;

Ang pagtitiyak ng aplikasyon ng RA sa mga astrocenoses ay natukoy;

Ang posibilidad ng paggamit ng RA para sa pag-aaral ng mga astrophysical system-cenoses ay natukoy sa mga sumusunod na plano:

Pagkilala sa mga subsystem sa mga sistema ng espasyo-cenoses; ang pamamaraan ay binubuo sa pag-aayos at pag-aaral ng mga kinks ng linear geological exploration graphs sa isang double logarithmic scale;

Pagtataya sa pagkakumpleto ng mga astrophysical system-cenoses;

Ang karagdagang pananaliksik sa direksyon na ito ay kinakailangan upang kumpirmahin ang mga konklusyon na iginuhit.

Bibliograpikong link

Ustinova K.A., Kozyrev D.A., Gurina R.V. RANK ANALYSIS BILANG ISANG PARAAN NG PANANALIKSIK AT ANG POSIBILIDAD NG APPLICATION NITO SA MGA ASTROPHYSICAL SYSTEMS // International Student Scientific Bulletin. – 2015. – Hindi. 3-4.;
URL: http://eduherald.ru/ru/article/view?id=14114 (petsa ng access: 12/26/2019). Dinadala namin sa iyong pansin ang mga magazine na inilathala ng publishing house na "Academy of Natural Sciences"

Empirically natagpuan ni George Zipf na ang dalas ng paggamit ng Nth na pinakamadalas na ginagamit na salita sa natural na mga wika ay humigit-kumulang inversely proportional sa numerong N at inilarawan ng may-akda sa aklat: Zipf G.R., Pag-uugali ng Tao at ang Prinsipyo ng Pinakamababang Pagsisikap, 1949

"Nalaman niya na ang pinakakaraniwang bagay sa wikang Ingles Ang salitang (“ang”) ay ginagamit nang sampung beses na mas madalas kaysa sa ikasampung pinakakaraniwang salita, 100 beses na mas madalas kaysa sa ika-100 pinakakaraniwang salita, at 1000 beses na mas madalas kaysa sa ika-1000 na pinakakaraniwang salita. Bilang karagdagan, ipinahayag na ang parehong pattern ay nalalapat sa bahagi ng merkado software, mga soft drink, kotse, matamis at para sa dalas ng pag-access sa mga site sa Internet. [...] Naging malinaw na sa halos lahat ng larangan ng aktibidad, ang pagiging numero uno ay mas mahusay kaysa sa pagiging numero tatlo o numero sampu. Higit pa rito, ang pamamahagi ng mga gantimpala ay hindi pantay-pantay, lalo na sa ating mundo na gusot sa iba't ibang network. At sa Internet ang mga pusta ay mas mataas pa. Ang mga market cap ng Priceline, eBay at Amazon ay umaabot 95% kabuuang market capitalization ng lahat ng iba pang lugar e-negosyo. Walang alinlangan, ang nanalo ay makakakuha ng maraming."

Seth Godin, Idea Virus? Epidemya! Gawing gumana ang mga customer para sa iyong mga benta, St. Petersburg, "Peter", 2005, p. 28.

"Ang kahulugan ng hindi pangkaraniwang bagay na ito ay iyon […] Ang kakayahan ng mga malikhaing kalahok na pumasok sa mga natapos na gawa ay ipinamamahagi sa mga kalahok alinsunod sa batas: ang produkto ng bilang ng mga pangyayari ayon sa ranggo ng kalahok (sa bilang ng mga kalahok na may parehong dalas ng paglitaw) ay isang pare-parehong halaga : f r = Const. […] Sa listahan ng ranggo ng lahat ng malikhaing kalahok, sa sa kasong ito salita, ito ay tiyak na pag-aari ng hindi pantay na pamamahagi ng kakayahan sa paglipat na ipinahayag, at kasama nito ang pattern ng koneksyon sa pagitan ng dami at kalidad sa malikhaing aktibidad sa pangkalahatan. […]

Bilang karagdagan sa mga mapagkukunang pampanitikan, sinuri ni Zipf ang maraming iba pang mga phenomena na kahina-hinala sa pamamahagi ng ranggo - mula sa pamamahagi ng populasyon sa mga lungsod hanggang sa pag-aayos ng mga tool sa workbench ng isang karpintero, mga libro sa mesa at istante ng isang siyentipiko, kahit saan ay natitisod sa parehong pattern.

Hindi alintana Zipf ang malapit na pamamahagi ay ipinahayag Pareto sa pag-aaral ng mga deposito sa bangko, ni Urquhart sa pagsusuri ng mga kahilingan para sa panitikan, Tray sa pagsusuri ng pagiging produktibo ng may-akda ng mga siyentipiko. Kahit na ang mga diyos ng Olympus, mula sa punto ng view ng kanilang pagkarga na may mga pag-andar na bumubuo ng kasanayan at pagpapanatili ng kasanayan, ay kumikilos ayon sa batas ng Zipf.

Sa pamamagitan ng pagsisikap Presyo at ang kanyang mga kasamahan, at nang maglaon sa pamamagitan ng pagsisikap ng maraming mga siyentipiko ay natagpuan na ang batas Zipf ay may direktang epekto sa pagpepresyo sa agham.

Presyo sa pagkakataong ito ay isinulat niya: "Ang lahat ng data na nauugnay sa pamamahagi ng mga katangian tulad ng antas ng pagiging perpekto, utility, produktibidad, laki ay napapailalim sa ilang hindi inaasahang ngunit simpleng mga pattern [...] Ang eksaktong hugis ba ng distribusyon na ito ay lognormal o geometric o inverse square o napapailalim sa batas Zipf, ay isang paksa ng pagtutukoy para sa bawat indibidwal na industriya. Ang alam namin ay ipahayag ang mismong katotohanan na ang alinman sa mga batas sa pamamahagi na ito ay nagbibigay ng mga resulta na malapit sa mga empirikal sa bawat industriyang pinag-aaralan, at ang gayong kababalaghan na karaniwan sa lahat ng mga industriya ay maliwanag na resulta ng pagkilos ng isang batas." Price D., Regular Patterns in the Organization of Science, Organon, 1965, No. 2., p. 246».

Petrov M.K. , Sining at Agham. Pirates of the Aegean Sea at personalidad, M., “Russian Political Encyclopedia, 1995, p. 153-154.

Bukod sa, George Zipf natagpuan din na ang pinakamadalas na ginagamit na mga salita ng isang wika na umiral sa mahabang panahon ay mas maikli kaysa sa iba. Ang madalas na paggamit ay nakakasira ng mga ito...