TIBCO Spotfire: Big Data Analytics. Үр дүнтэй бизнесийн оюун ухаан ба чанарын мэдээллийн дүн шинжилгээ Хэрэглэгчийн мэдээллийг хэрхэн олж авах вэ

Визуал аналитик ашиглан том өгөгдөлтэй ажиллах боломжтой

TIBCO Spotfire платформыг ашиглан Big Data-д нуугдсан мэдээллийг ашиглан бизнесийн оюун ухаанаа сайжруулж, ердийн асуудлуудыг шийдээрэй. Энэ нь бизнесийн хэрэглэгчдэд мэдээллийн технологийн мэргэжилтнүүд, тусгай боловсролыг оролцуулалгүйгээр Big Data аналитик технологийг бүрэн хэмжээгээр ашиглах боломжийг олгодог ойлгомжтой, хэрэглэгчдэд ээлтэй хэрэглэгчийн интерфейсээр хангадаг цорын ганц платформ юм.

Spotfire интерфэйс нь жижиг өгөгдлийн багц болон том өгөгдлийн олон терабайт кластертай ажиллахад адилхан хялбар болгодог: мэдрэгчийн уншилт, нийгмийн сүлжээн дэх мэдээлэл, борлуулалтын цэгүүд эсвэл газарзүйн байршлын эх сурвалж. Бүх ур чадварын түвшний хэрэглэгчид олон тэрбум өгөгдлийн цэгүүдийг нэгтгэсэн график дүрслэл болох дүрслэлийг ашиглан ухаалаг хяналтын самбар болон аналитик ажлын урсгалд хялбархан хандах боломжтой.

Урьдчилан таамаглах аналитик нь хийх замаар суралцах явдал юм хуваалцсан туршлагакомпаниуд илүү мэдээлэлтэй шийдвэр гаргах. Spotfire Predictive Analytics-ийг ашигласнаар та бизнесийн тагнуулын мэдээллээс зах зээлийн шинэ чиг хандлагыг олж илрүүлж, эрсдэлийг бууруулах арга хэмжээ авч, удирдлагын шийдвэрийнхээ чанарыг сайжруулах боломжтой.

Хяналт

Өндөр гүйцэтгэлтэй аналитикт зориулсан том өгөгдлийн холболт

Spotfire нь Hadoop болон бусад том өгөгдлийн эх сурвалжтай тасралтгүй нэгдсэн гурван үндсэн төрлийн аналитикийг санал болгодог.

  1. Хүсэлтийн дагуу аналитик: Хэт хурдан, интерактив өгөгдөл дүрслэлийг хөнгөвчлөх суурилуулсан, хэрэглэгчийн тохируулж болох өгөгдлийн холбогч.
  2. Өгөгдлийн сан дахь дүн шинжилгээ (In-Database Analytics): Том өгөгдөлд суурилсан аливаа нарийн төвөгтэй байдлын өгөгдлийн тооцоолол хийх боломжийг олгодог тархсан тооцоолох платформтой нэгтгэх.
  3. Шинжилгээ санамсаргүй хандалт санах ой(In-Memory Analytics): Уламжлалт болон шинэ мэдээллийн эх сурвалж зэрэг аливаа мэдээллийн эх сурвалжаас өгөгдлийг шууд татаж авдаг статистик шинжилгээний платформтой нэгтгэх.

Эдгээр нэгтгэх аргууд нь визуал хайгуул болон дэвшилтэт аналитикийн хүчирхэг хослолыг төлөөлдөг.
Энэ нь бизнесийн хэрэглэгчдэд хүчирхэг, хэрэглэхэд хялбар хяналтын самбар болон ажлын урсгалаар дамжуулан дурын мэдээллийн эх сурвалжаас өгөгдөлд хандах, нэгтгэх, дүн шинжилгээ хийх боломжийг олгодог.

Том өгөгдөл холбогч

Spotfire Big Data Connectors нь бүх төрлийн өгөгдлийн хандалтыг дэмждэг: өгөгдлийн эх сурвалж, санах ойн доторх, эрэлт хэрэгцээтэй. Суулгасан Spotfire өгөгдлийн холбогч нь:

  • Apache Hive, Apache Spark SQL, Cloudera Hive, Cloudera Impala, Databricks Cloud, Hortonworks, MapR Drill болон Pivotal HAWQ-д зориулсан баталгаажуулсан Hadoop дата холбогч.
  • Бусад баталгаажсан том өгөгдөл холбогчдод Teradata, Teradata Aster, Netezza орно
  • OSI PI мэдрэгч мэдрэгч зэрэг эх сурвалжаас авсан түүхэн болон одоогийн өгөгдөлд зориулсан холбогч

Мэдээллийн эх сурвалж дахь тархсан тооцоолол

Spotfire-ын өгөгдлийн эх үүсвэрээр тархсан өгөгдөлд хандах SQL асуулгад зориулсан үйлдлүүдийг нүдээр сонгоход тохиромжтой функцээс гадна Spotfire нь өгөгдлийн эх үүсвэрт ажилладаг статистик болон машин сургалтын алгоритмуудыг үүсгэж, зөвхөн Spotfire системд дүрслэл үүсгэхэд шаардлагатай үр дүнг буцаах боломжтой.

  • Хэрэглэгчид TERR хэлний суурилагдсан чадамжийг ашиглан скриптүүдэд хандах харааны сонголт бүхий хяналтын самбартай ажилладаг.
  • TERR скриптүүд нь Map/Reduce, H2O, SparkR, эсвэл Fuzzy Logix-тэй хамтран тархсан тооцооллын функцийг эхлүүлдэг.
  • Эдгээр програмууд нь эргээд Hadoop эсвэл бусад мэдээллийн эх сурвалж зэрэг өндөр үр ашигтай системд ханддаг.
  • TERR-ийг MapReduce эсвэл Spark ашиглан удирддаг Hadoop зангилаанууд дээр дэвшилтэт аналитик хөдөлгүүр болгон ашиглаж болно. TERR хэлийг Teradata мэдээллийн зангилаанд бас ашиглаж болно.
  • Үр дүнг Spotfire дээр харуулав.

Нарийвчилсан аналитикт зориулсан TERR

TIBCO Enterprise Runtime for R (TERR) – TERR нь компанийн S+-тэй холбоотой олон арван жилийн аналитик мэдлэгийг ашиглан R хэлэнд бүрэн нийцүүлэх зорилгоор TIBCO-оос боловсруулсан аж ахуйн нэгжийн түвшний статистикийн багц юм. Энэ нь хэрэглэгчдэд нээлттэй R кодыг ашиглан программ болон загвараа үргэлжлүүлэн хөгжүүлээд зогсохгүй өөрийн кодыг дахин бичих шаардлагагүйгээр арилжааны хувьд хүчирхэг платформ дээр өөрийн R кодыг нэгтгэж, байршуулах боломжийг олгодог. TERR нь өндөр үр ашигтай, найдвартай санах ойн менежменттэй бөгөөд илүү ихийг өгдөг өндөр хурднээлттэй эхийн R хэлтэй харьцуулахад их хэмжээний өгөгдлийг боловсруулах.

Бүх функцийг хослуулсан

Дээр дурдсан хүчирхэг функцүүдийн хослол нь өндөр итгэлтэй аналитик шаарддаг хамгийн төвөгтэй ажлуудын хувьд ч хэрэглэгчид энгийн, хэрэглэхэд хялбар интерактив ажлын урсгалтай харьцдаг гэсэн үг юм. Энэ нь бизнесийн хэрэглэгчдэд бизнесийн шинжилгээнд үндэслэсэн өгөгдлийн архитектурын нарийн ширийнийг мэдэх шаардлагагүйгээр өгөгдлийг дүрслэн харуулах, дүн шинжилгээ хийх, аналитик үр дүнг хуваалцах боломжийг олгодог.

Жишээ нь: Алдагдсан ачааг тодорхойлох загварын үр дүнг тохируулах, ажиллуулах, дүрслэх зориулалттай Spotfire интерфейс. Энэхүү интерфэйсийг ашиглан бизнесийн хэрэглэгчид Hadoop кластерт хадгалагдсан гүйлгээ, тээвэрлэлтийн өгөгдөлд хандах замаар TERR болон H2O (тархсан тооцооллын систем) ашиглан тооцоо хийх боломжтой.

Big Data Analytics Space


Нарийвчилсан болон урьдчилан таамаглах аналитик

Хэрэглэгчид Spotfire хяналтын самбарыг харааны сонголтын функцтэй ашиглан урьдчилан таамаглах, загвар үүсгэх, оновчтой болгоход хялбар болгодог. Том өгөгдлийг ашиглан дүн шинжилгээг өгөгдлийн эх сурвалж (In-Datasource) дотор хийж, зөвхөн нэгтгэсэн мэдээлэл, Spotfire платформ дээр дүрслэл үүсгэхэд шаардлагатай үр дүнг буцаана.


Машины сургалт

Маш олон төрлийн машин сургалтын хэрэгслүүдийг нэг товшилтоор ашиглах боломжтой Spotfire-ийн суулгасан функцуудын жагсаалтад авах боломжтой. Статистикчид R хэл дээр бичигдсэн програмын кодыг ашиглах боломжтой бөгөөд ашигласан функцийг өргөжүүлэх боломжтой. Машин сургалтын функцийг дахин ашиглахад хялбар болгох үүднээс бусад хэрэглэгчидтэй хуваалцаж болно.

Боломжтой дараах аргууд Spotfire болон TERR дээр тасралтгүй ангилсан хувьсагчдад зориулсан машин сургалт:

  • Шугаман ба логистик регресс
  • Шийдвэрийн мод (Шийдвэрийн мод), санамсаргүй ойн алгоритм (Random forest), градиент нэмэгдүүлэх машин (GBM)
  • Ерөнхий шугаман (нэмэлт) загварууд (Ерөнхий нэмэлт загварууд)
  • Мэдрэлийн сүлжээ


Агуулгын шинжилгээ

Spotfire нь урьд өмнө ашиглагдаагүй өгөгдлийн аналитик, дүрслэлийг өгдөг - энэ нь баримт бичиг, тайлан, тэмдэглэл гэх мэт эх сурвалжид хадгалагддаг бүтэцгүй текст юм. CRM системүүд, вэбсайтын бүртгэл, нийгмийн сүлжээн дэх нийтлэлүүд болон бусад олон зүйл.


Байршлын аналитик

Олон давхаргат газрын зураг өндөр нарийвчлалтайнь том өгөгдлийг дүрслэн харуулах гайхалтай арга юм. Spotfire-ийн баялаг газрын зургийн функц нь танд хэрэгтэй олон лавлагаа болон функциональ давхарга бүхий газрын зураг үүсгэх боломжийг олгодог. Spotfire нь танд газрын зурагтай ажиллах явцад нарийн төвөгтэй аналитик ашиглах боломжийг олгодог. Үүнээс гадна газарзүйн газрын зурагсистем нь хэрэглэгчийн зан төлөв, агуулах, үйлдвэрлэл, түүхий эд болон бусад олон үзүүлэлтүүдийг дүрслэн харуулах газрын зураг үүсгэдэг.

Сүүлийн үед мэдээллийн шинжилгээний талаар маш их ярьж, маш их ярьж байгаа тул асуудлын талаар бүрэн эргэлзэж болно. Үүнийг олон хүн анхаарч байгаа нь сайн хэрэг одоогийн сэдэв. Цорын ганц муу зүйл бол энэ нэр томъёогоор хүн бүр өөрт хэрэгтэй зүйлээ ойлгодог бөгөөд ихэнхдээ асуудлын ерөнхий дүр зургийг олж чаддаггүй. Энэ хандлагын хуваагдал нь юу болж байгаа, юу хийх ёстойг ойлгохгүй байх шалтгаан болдог. Бүх зүйл хоорондоо чөлөөтэй холбогдсон хэсгүүдээс бүрддэг бөгөөд нийтлэг цөмгүй байдаг. Та "нөхөн ажлын автоматжуулалт" гэсэн хэллэгийг олонтаа сонссон байх. Олон хүмүүс энэ асуудалтай өмнө нь олон удаа тулгарч байсан бөгөөд энэ аргын гол асуудал бол том дүр зургийг харах боломжгүй байдаг гэдгийг баталж чадна. Шинжилгээтэй төстэй нөхцөл байдал.

Шинжилгээний механизм бүрийн газар, зорилгыг ойлгохын тулд бүгдийг нь бүхэлд нь авч үзье. Бодол хэрхэн төрдөгийг тайлбарлаж чадахгүй байгаа тул бид энэ үйл явцад мэдээллийн технологийг хэрхэн ашиглах талаар анхаарлаа төвлөрүүлэх болно. Эхний хувилбар нь шийдвэр гаргагч (ШМ) компьютерийг зөвхөн мэдээлэл авах хэрэгсэл болгон ашигладаг бөгөөд бие даан дүгнэлт гаргадаг. Энэ төрлийн асуудлыг шийдвэрлэхийн тулд тайлангийн систем, олон хэмжээст өгөгдлийн дүн шинжилгээ, график болон бусад дүрслэх аргуудыг ашигладаг. Хоёрдахь сонголт: програм нь зөвхөн өгөгдлийг задлахаас гадна янз бүрийн урьдчилсан боловсруулалт, жишээлбэл, цэвэрлэх, тэгшлэх гэх мэт ажлыг гүйцэтгэдэг. Мөн энэ аргаар боловсруулсан өгөгдөлд дүн шинжилгээ хийх математик аргуудыг ашигладаг - кластер, ангилал, регресс гэх мэт. Энэ тохиолдолд шийдвэр гаргагч нь түүхий биш, харин өндөр боловсруулсан өгөгдлийг хүлээн авдаг, i.e. хүн аль хэдийн компьютерээр бэлтгэсэн загваруудтай ажилладаг.

Эхний тохиолдолд шийдвэр гаргах механизмтай холбоотой бараг бүх зүйл өөрөө хүнд даатгагддаг тул зохих загварыг сонгох, боловсруулах аргыг сонгох асуудал нь шинжилгээний механизмын хязгаараас давж гардаг. Шийдвэр гаргах үндэс нь зааварчилгаа (жишээлбэл, хазайлтанд хариу үйлдэл үзүүлэх механизмыг хэрхэн хэрэгжүүлэх), эсвэл зөн совин юм. Зарим тохиолдолд энэ нь хангалттай боловч хэрэв шийдвэр гаргагч нь нэлээд гүн гүнзгий мэдлэгийг сонирхож байгаа бол зүгээр л өгөгдөл олборлох механизм энд тус болохгүй. Илүү ноцтой боловсруулалт хийх шаардлагатай. Энэ бол хоёр дахь тохиолдол юм. Урьдчилан боловсруулах, дүн шинжилгээ хийх бүх механизм нь шийдвэр гаргагчид илүү өндөр түвшинд ажиллах боломжийг олгодог өндөр түвшин. Эхний хувилбар нь тактикийн болон үйл ажиллагааны асуудлыг шийдвэрлэхэд тохиромжтой, хоёр дахь нь мэдлэгийг хуулбарлах, стратегийн асуудлыг шийдвэрлэхэд тохиромжтой.

Хамгийн тохиромжтой тохиолдол бол дүн шинжилгээ хийх хоёр аргыг хоёуланг нь ашиглах боломжтой байх болно. Эдгээр нь бизнесийн мэдээлэлд дүн шинжилгээ хийх бараг бүх байгууллагын хэрэгцээг хангах боломжийг танд олгоно. Даалгавраас хамааран техникийг өөрчилснөөр бид ямар ч тохиолдолд байгаа мэдээллээс хамгийн их хэмжээгээр шахах боломжтой болно.

Ажлын ерөнхий схемийг доор өгөв.

Ихэнхдээ бизнесийн мэдээлэлд дүн шинжилгээ хийдэг бүтээгдэхүүнийг тайлбарлахдаа эрсдэлийн удирдлага, урьдчилан таамаглах, зах зээлийн сегментчилэл гэх мэт нэр томьёо ашигладаг... Гэвч бодит байдал дээр эдгээр асуудал тус бүрийг шийдвэрлэх нь доор тайлбарласан шинжилгээний аргуудын аль нэгийг ашиглахад хүргэдэг. Жишээлбэл, урьдчилан таамаглах нь регрессийн асуудал, зах зээлийн сегментчилэл нь бөөгнөрөл, эрсдэлийн удирдлага нь кластер, ангиллын хослол, бусад аргууд боломжтой. Тиймээс энэхүү багц технологи нь бизнесийн ихэнх асуудлыг шийдвэрлэх боломжийг бидэнд олгодог. Үнэн хэрэгтээ эдгээр нь тодорхой асуудлын шийдлийг цуглуулдаг атомын (үндсэн) элементүүд юм.

Одоо бид хэлхээний фрагмент бүрийг тусад нь тайлбарлах болно.

Шийдвэр гаргахад хэрэгтэй бүх мэдээллийг ашиглах шаардлагатай тул мэдээллийн үндсэн эх сурвалж нь аж ахуйн нэгжийн удирдлагын систем, оффисын баримт бичиг, интернетийн мэдээллийн сан байх ёстой. Түүнээс гадна бид ярьж байназөвхөн байгууллагын дотоод мэдээлэл төдийгүй гадаад мэдээллийн талаар (макро эдийн засгийн үзүүлэлтүүд, өрсөлдөөнт орчин, хүн ам зүйн мэдээлэл гэх мэт).

Мэдээллийн агуулах нь шинжилгээний технологийг хэрэгжүүлдэггүй ч аналитик системийг бий болгох үндэс суурь болдог. Мэдээллийн агуулах байхгүй тохиолдолд дүн шинжилгээ хийхэд шаардлагатай мэдээллийг цуглуулах, зохион байгуулахад ихэнх цаг хугацаа шаардагдах бөгөөд энэ нь шинжилгээний бүх ашиг тусыг үгүйсгэх болно. Эцсийн эцэст, нэг нь гол үзүүлэлтүүдАливаа аналитик систем нь үр дүнг хурдан авах боломжтой.

Диаграммын дараагийн элемент нь семантик давхарга юм. Мэдээллийг хэрхэн шинжлэхээс үл хамааран шийдвэр гаргагчид ойлгомжтой байх шаардлагатай, учир нь ихэнх тохиолдолд дүн шинжилгээ хийсэн өгөгдөл нь янз бүрийн мэдээллийн санд байрладаг бөгөөд шийдвэр гаргагч нь DBMS-тэй ажиллах нарийн ширийн зүйлийг судлах ёсгүй. нэр томъёог өөрчилдөг механизм бий болгох шаардлагатай байна сэдвийн хэсэгөгөгдлийн санд нэвтрэх механизм руу залгахад. Энэ ажлыг семантик давхарга гүйцэтгэдэг. Шинжилгээний бүх хэрэглээнд адилхан байх нь зүйтэй тул асуудалд өөр өөр хандлагыг ашиглах нь илүү хялбар байдаг.

Мэдээллийн системүүд нь "юу болж байна" гэсэн асуултанд хариулах зориулалттай. Үүнийг ашиглах эхний сонголт: үйл ажиллагааны нөхцөл байдлыг хянах, хазайлтыг шинжлэхэд тогтмол тайланг ашигладаг. Жишээлбэл, систем нь агуулах дахь бүтээгдэхүүний үлдэгдлийн талаархи өдөр тутмын тайланг бэлтгэдэг бөгөөд үнэ нь долоо хоногийн дундаж борлуулалтаас бага байвал худалдан авах захиалга бэлтгэх замаар хариу өгөх шаардлагатай байдаг, өөрөөр хэлбэл ихэнх тохиолдолд эдгээр нь стандартчилсан бизнесийн гүйлгээ юм. Ихэнх тохиолдолд энэ аргын зарим элементүүдийг компаниудад нэг хэлбэрээр (цаасан дээр байсан ч) хэрэгжүүлдэг боловч энэ нь өгөгдөлд дүн шинжилгээ хийх цорын ганц боломжит арга байж болохгүй. Тайлангийн системийг ашиглах хоёр дахь сонголт: түр зуурын хүсэлтийг боловсруулах. Шийдвэр гаргагч аливаа бодлыг (таамаглалыг) шалгахыг хүсвэл тэр санааг батлах эсвэл үгүйсгэх хоол хүнс авах шаардлагатай байдаг, учир нь эдгээр бодлууд аяндаа гарч ирдэг бөгөөд ямар мэдээлэл шаардагдах талаар нарийн ойлголт байдаггүй. , энэ мэдээллийг хурдан шуурхай, тохиромжтой хэлбэрээр авах боломжийг олгодог хэрэгсэл хэрэгтэй. Олж авсан өгөгдлүүдийг ихэвчлэн хүснэгт, график, график хэлбэрээр үзүүлэв, гэхдээ бусад танилцуулга хийх боломжтой.

Хэдийгээр тайлагнах системийг бий болгоход янз бүрийн аргыг ашиглаж болох ч өнөөдөр хамгийн түгээмэл нь OLAP механизм юм. Үндсэн санаа нь мэдээллийг олон хэмжээст шоо хэлбэрээр харуулах явдал бөгөөд тэнхлэгүүд нь хэмжээсийг (жишээ нь, цаг хугацаа, бүтээгдэхүүн, үйлчлүүлэгчид), нүднүүдэд үзүүлэлтүүдийг (жишээлбэл, борлуулалтын хэмжээ, дундаж үнэхудалдан авалт). Хэрэглэгч хэмжилтийг удирдаж, хүссэн нөхцөлд мэдээлэл хүлээн авдаг.

OLAP нь ойлгоход хялбар, өгөгдлийн шинжилгээний хөдөлгүүр болгон өргөн хэрэглэгдэх болсон тул урьдчилан таамаглах гэх мэт гүнзгий дүн шинжилгээ хийх чадвар нь маш хязгаарлагдмал гэдгийг ойлгох хэрэгтэй. Урьдчилан таамаглах асуудлыг шийдвэрлэх гол асуудал бол сонирхож буй өгөгдлийг хүснэгт, график хэлбэрээр гаргаж авах чадвар биш, харин зохих загварыг бий болгох явдал юм. Дараа нь бүх зүйл маш энгийн. Одоо байгаа загварын оролтод шинэ мэдээлэл орж, түүгээр дамжуулж, үр дүн нь урьдчилсан мэдээ юм. Гэхдээ загвар бүтээх нь туйлын энгийн ажил биш юм. Мэдээжийн хэрэг, та хэд хэдэн бэлэн болон нэмж болно энгийн загварууджишээлбэл, шугаман регресс эсвэл үүнтэй төстэй зүйл бол ихэнхдээ яг ийм зүйл хийдэг, гэхдээ энэ нь асуудлыг шийдэж чадахгүй. Бодит ертөнцийн асуудлууд бараг үргэлж ийм энгийн загвараас давж гардаг. Иймээс ийм загвар нь зөвхөн илт хамаарлыг илрүүлэх, илрүүлэх үнэ цэнэ нь өчүүхэн, аль нь аль хэдийн мэдэгдэж байгаа, эсвэл хэтэрхий бүдүүлэг таамаглал дэвшүүлэх бөгөөд энэ нь бас огт сонирхолгүй юм. Жишээлбэл, хэрэв та хөрөнгийн зах зээл дээрх хувьцааны үнэд дүн шинжилгээ хийхдээ маргааш хувьцаа нь өнөөдрийнхтэй ижил үнэтэй байх болно гэсэн энгийн таамаглалаас үндэслэж байвал 90% тохиолдолд та зөв байх болно. Ийм мэдлэг хэр үнэ цэнэтэй вэ? Зөвхөн үлдсэн 10% нь брокеруудын сонирхлыг татдаг. Ихэнх тохиолдолд анхдагч загварууд нь ойролцоогоор ижил түвшний үр дүнг өгдөг.

Загвар бүтээх зөв арга бол тэдгээрийг алхам алхмаар сайжруулах явдал юм. Эхний, харьцангуй бүдүүлэг загвараас эхлээд шинэ өгөгдөл хуримтлагдаж, загвар практикт хэрэгжиж байгаа тул үүнийг сайжруулах шаардлагатай байна. Урьдчилан таамаглах, үүнтэй төстэй зүйл хийх бодит ажил нь тайлагнах системийн механизмаас давж гардаг тул та энэ чиглэлд хүлээх хэрэггүй. эерэг үр дүн OLAP ашиглах үед. Нарийвчилсан дүн шинжилгээ хийх асуудлыг шийдвэрлэхийн тулд мэдээллийн сан дахь мэдлэгийг олж илрүүлэх нэрийн дор нэгтгэсэн тэс өөр технологи ашигладаг.

Өгөгдлийн сан дахь мэдлэгийг илрүүлэх (KDD) нь өгөгдлийг мэдлэг болгон хувиргах үйл явц юм. KDD нь өгөгдөл бэлтгэх, мэдээллийн шинж чанарыг сонгох, өгөгдлийг цэвэрлэх, өгөгдөл олборлох (DM) аргыг хэрэглэх, өгөгдлийг дараах боловсруулалт, үр дүнг тайлбарлах зэрэг асуудлуудыг багтаадаг. Өгөгдлийн олборлолт гэдэг нь хүний ​​үйл ажиллагааны янз бүрийн чиглэлээр шийдвэр гаргахад шаардлагатай, урьд өмнө мэдэгдээгүй, өчүүхэн бус, практикт хэрэг болохуйц, тайлбарлах боломжтой мэдлэгийг “түүхий” хэлбэрээр олж илрүүлэх үйл явц юм.

Энэхүү аргын сонирхол татахуйц тал нь тухайн сэдвээс үл хамааран бид ижил үйлдлүүдийг ашигладаг явдал юм.

  1. Өгөгдлийг задлах. Манай тохиолдолд энэ нь семантик давхарга шаарддаг.
  2. Өгөгдлийг арилгах. Шинжилгээнд "бохир" өгөгдлийг ашиглах нь ирээдүйд ашиглагдах шинжилгээний механизмыг бүрэн үгүйсгэж чадна.
  3. Өгөгдлийг хувиргах. Төрөл бүрийн шинжилгээний аргууд нь тусгай хэлбэрээр бэлтгэсэн өгөгдлийг шаарддаг. Жишээлбэл, хаа нэг газар зөвхөн дижитал мэдээллийг оролт болгон ашиглаж болно.
  4. Бодит дүн шинжилгээ хийх - Өгөгдлийн олборлолт.
  5. Хүлээн авсан үр дүнг тайлбарлах.

Энэ үйл явц дахин давтагдана.

Дата олборлолт нь эргээд ангилал, бөөгнөрөл, регресс, холбоо, дараалал, хазайлтын шинжилгээ гэсэн 6 асуудлыг л шийддэг.

Мэдлэг олж авах үйл явцыг автоматжуулахын тулд үүнийг хийх шаардлагатай. Шийдвэр гаргагч гэгддэг шинжээч цаашдын алхмуудыг аль хэдийн хийж байна.

Компьютерийн боловсруулалтын үр дүнг тайлбарлах нь хүмүүст хамаарна. Зүгээр л янз бүрийн аргасэтгэн бодох янз бүрийн хоолоор хангах. Маш их энгийн тохиолдолЭдгээр нь хүснэгт, диаграммууд бөгөөд илүү төвөгтэй загварууд ба дүрмүүд юм. Хүний оролцоог бүрэн үгүйсгэх боломжгүй, учир нь нэг эсвэл өөр үр дүн нь тодорхой сэдвийн хүрээнд хэрэглэгдэх хүртэл ямар ч утгагүй болно. Гэсэн хэдий ч мэдлэгийг хуулбарлах боломжтой. Жишээлбэл, шийдвэр гаргагч ямар нэг аргыг ашиглан худалдан авагчдын зээлийн чадварт ямар үзүүлэлт нөлөөлж байгааг тодорхойлж, үүнийг дүрмийн хэлбэрээр танилцуулав. Уг журмыг зээл олгох системд нэвтрүүлж, үнэлгээг нь хэрэгжүүлэх замаар зээлийн эрсдэлийг эрс бууруулах боломжтой. Үүний зэрэгцээ баримт бичгийг бодитоор гаргаж авахад оролцсон хүн энэ эсвэл бусад дүгнэлтийн шалтгааныг гүнзгий ойлгох шаардлагагүй болно. Үнэн хэрэгтээ энэ нь нэг удаа үйлдвэрлэлд хэрэглэж байсан аргуудыг мэдлэгийн менежментийн талбарт шилжүүлэх явдал юм. Гол санаа нь нэг удаагийн болон нэгдмэл бус аргаас конвейерт шилжих явдал юм.

Дээр дурдсан бүх зүйл бол зөвхөн даалгаврын нэрс юм. Тэдгээрийг шийдвэрлэхийн тулд та сонгодог статистик аргуудаас эхлээд өөрөө суралцах алгоритм хүртэл янз бүрийн арга техникийг ашиглаж болно. Бизнесийн бодит асуудлуудыг дээр дурдсан аргуудын аль нэгээр нь эсвэл тэдгээрийн хослолоор бараг үргэлж шийддэг. Бараг бүх даалгавар - урьдчилан таамаглах, зах зээлийн сегментчилэл, эрсдлийн үнэлгээ, гүйцэтгэлийн үнэлгээ сурталчилгааны кампанит ажил, зэрэг өрсөлдөх давуу талболон бусад олон - дээр дурдсан зүйлс рүү буцалгана. Тиймээс, өгөгдсөн даалгаврын жагсаалтыг шийдвэрлэх хэрэгсэл таны мэдэлд байгаа тул та бизнесийн шинжилгээний аливаа асуудлыг шийдвэрлэхэд бэлэн байна гэж хэлж болно.

Хэрэв та анзаарсан бол бид дүн шинжилгээ хийхэд ямар хэрэгсэл, ямар технологи гэх мэтийг дурдаагүй. даалгаврууд болон тэдгээрийг шийдвэрлэх арга хэрэгсэл нь багаж хэрэгслээс хамаардаггүй. Энэ бол асуудалд чадварлаг хандлагын тодорхойлолт юм. Та юу ч ашиглаж болно, цорын ганц чухал зүйл бол даалгаврын жагсаалтыг бүхэлд нь хамарсан байх явдал юм. Энэ тохиолдолд бид үнэхээр бүрэн ажиллагаатай шийдэл байдаг гэж хэлж болно. Ихэнх тохиолдолд даалгаврын багахан хэсгийг хамарсан механизмыг "бизнесийн шинжилгээний асуудлыг шийдвэрлэх бүрэн шийдэл" болгон санал болгодог. Ихэнх тохиолдолд зөвхөн OLAP нь бизнесийн мэдээллийн шинжилгээний систем гэж ойлгогддог бөгөөд энэ нь бүрэн дүн шинжилгээ хийхэд бүрэн хангалтгүй байдаг. Зузаан сурталчилгааны лоозон дор зөвхөн мэдээлэх систем л байдаг. Энэ эсвэл өөр шинжилгээний хэрэгслийн үр дүнтэй тайлбар нь мөн чанарыг нууж байгаа боловч санал болгож буй схемээс эхлэхэд хангалттай бөгөөд та бодит байдлыг ойлгох болно.

(Бизнесийн ухааны).

Майкрософт, IBM, Google, Yandex, MTS гэх мэт өндөр технологийн компаниудад амжилттай ажиллаж буй залуу мэргэжилтнүүдийг семинарт илтгэгчээр урьж, оюутнуудад бизнесийн зарим асуудлын талаар ярьж өгдөг Эдгээр компаниудад өгөгдөл хэрхэн хуримтлагддаг, өгөгдөлд дүн шинжилгээ хийх асуудал хэрхэн үүсдэг, тэдгээрийг шийдвэрлэхэд ямар арга хэрэглэж болох талаар.

Уригдсан бүх мэргэжилтнүүд харилцахад нээлттэй бөгөөд оюутнууд тэдэнтэй холбогдож зөвлөгөө авах боломжтой.

Семинарын зорилго:

  • их сургуулийн судалгаа, өгөгдлийн шинжилгээний чиглэлээр практик асуудлыг шийдвэрлэх хоорондын зөрүүг арилгахад туслах;
  • одоогийн болон ирээдүйн мэргэжилтнүүдийн хооронд туршлага солилцохыг дэмжих.
Семинар Москвагийн Улсын Их Сургуулийн Тооцооллын Математик, Математикийн факультетэд баасан гаригт тогтмол явагддаг. 18:20 , үзэгчид P5(нэгдүгээр давхар).

Семинарт оролцох нь үнэ төлбөргүй(Хэрэв танд Москвагийн Улсын Их Сургуульд суралцах эрхийн бичиг байхгүй бол ээлжийн оролцогчдын жагсаалтыг ирүүлэхийн тулд семинар зохион байгуулагчдад овог нэрээ урьдчилан мэдэгдэнэ үү).

Семинарын хөтөлбөр

огнооИлтгэгч ба семинарын сэдэв
2010 оны есдүгээр сарын 10
18:20
Александр Ефимов , аналитик хэлтсийн дарга жижиглэнгийн сүлжээ MTS.

Маркетингийн кампанит ажлын үр нөлөөг урьдчилан таамаглах, дэлгүүрийн нэр төрлийг оновчтой болгох.

  • Хэрэглэсэн асуудлын хуудас: Жижиглэн худалдааны цэгүүдийн нэр төрлийг оновчтой болгох (өгөгдөл бүхий даалгавар).
2010 оны есдүгээр сарын 17
18:20
Вадим Стрижов , Оросын ШУА-ийн Тооцоолох төвийн судлаач.

Банкны зээлийн оноо: автоматаар үүсгэх, загвар сонгох аргууд.

Онооны картыг бий болгох сонгодог болон шинэ технологийг авч үздэг. Семинарт харилцагчийн мэдээлэл хэрхэн зохион байгуулагдаж, олон улсын банкны стандартын шаардлагад нийцсэн хамгийн боломжит онооны загварыг хэрхэн гаргах талаар ярилцана.

2010 оны есдүгээр сарын 24
18:20
Владимир Крекотен , Откритие брокерийн газрын Маркетинг, борлуулалтын хэлтсийн дарга.

Өргөдөл математик аргуудүйлчлүүлэгчийн алдагдлыг урьдчилан таамаглах, эсэргүүцэх.

Шинжилгээнд гарч буй практик асуудлуудыг авч үзсэн болно үйлчлүүлэгчийн баазмаркетингийн чиглэлээр. Үйлчлүүлэгчдийг бүлэглэх, сегментлэх, шинэ үйлчлүүлэгчдэд оноо авах, зорилтот сегментийн динамикийг хянах даалгавруудыг тавьсан.

  • Хэрэглэсэн асуудлын хуудас: Брокерын компанийн үйлчлүүлэгчдийн бүлэглэл (өгөгдөл бүхий даалгавар).
2010 оны аравдугаар сарын 1
18:20
Николай Филипенков , болон тухай. Москвагийн банкны зээлийн үнэлгээний хэлтсийн дарга.

Жижиглэнгийн зээлийн эрсдэлийг удирдах математик аргуудыг ашиглах.

Онооны загвар болон эрсдлийн үнэлгээг бий болгох зарим практик талыг авч үзсэн.

  • Хэрэглээний асуудлын хуудас: Жижиглэнгийн зээлийн эрсдэлийн удирдлага (Өгөгдлийн асуудал) .
2010 оны аравдугаар сарын 8
18:20
Федор Романенко , Хайлтын чанарын менежер, Yandex.

Вэб хайлтын зэрэглэлийн түүх, зарчим.

Интернэт хайлтын асуудалд текст, холбоосын зэрэглэлээс эхлээд Machine Learning Rank хүртэл мэдээлэл хайх аргуудыг ашиглах, хөгжүүлэх асуудлыг авч үзсэн. Орчин үеийн вэб зэрэглэлийн үндсэн зарчмуудыг хайлтын системийн амжилтын түүхтэй холбон тайлбарласан болно. Хайлтын чанарт үзүүлэх нөлөөнд онцгой анхаарал хандуулдаг зах зээлийн үзүүлэлтүүдмөн үүнийг сайжруулахын тулд тасралтгүй ажиллах амин чухал хэрэгцээ юм.

2010 оны аравдугаар сарын 15
18:20
Виталий Голдштейн , хөгжүүлэгч, Yandex.

Гео мэдээллийн үйлчилгээ Yandex.

Энэ нь Yandex.Traffic төсөл болон бусад Yandex геомэдээллийн төслүүдийн талаар, барилгын ажлын эх сурвалжийн мэдээлэл хаанаас ирдэг тухай өгүүлдэг. гео мэдээллийн систем, шинэ өргөтгөх боломжтой өгөгдөл боловсруулах технологийн тухай, Интернет математикийн тэмцээн болон зарим ирээдүйтэй асуудлуудын талаар. Мэдээллийг өгч, замын зураглалыг сэргээн засварлах асуудлын албан ёсны тайлбарыг өгсөн болно.

  • Хэрэглэсэн асуудлын хуудас: Тээврийн хэрэгслийн зам дээрх өгөгдлийг ашиглан замын график байгуулах (өгөгдөл бүхий даалгавар).
2010 оны аравдугаар сарын 22Семинарыг цуцалсан.
2010 оны аравдугаар сарын 29
18:20
Федор Краснов , Бизнесийн үйл явц хариуцсан дэд ерөнхийлөгч ба мэдээллийн технологи, АКАДО.

Хэрэглэгчийн мэдээллийг хэрхэн авах вэ?

Томоохон хэрэглэгчидтэй олон арван жилийн турш хамтран ажилласан Force компани нь бизнесийн шинжилгээний чиглэлээр асар их туршлага хуримтлуулсан бөгөөд одоо биг дата технологийг идэвхтэй хөгжүүлж байна. CNews-д өгсөн ярилцлагадаа захирал Ольга Горчинская судалгааны төслүүдболон Big Data "Force" компанийн тэргүүн.

15.10.2015

Ольга Горчинская

Сүүлийн жилүүдэд удирдагчдын нэг үе солигдсон. Мэдээлэлжүүлэлтийн эрин үед карьераа хийсэн компаниудыг удирдах шинэ хүмүүс гарч ирсэн бөгөөд тэд компьютер, интернет, ашиглахад дассан байв. хөдөлгөөнт төхөөрөмжүүдяаж орох вэ Өдөр тутмын амьдралмөн ажлын асуудлыг шийдвэрлэхэд зориулагдсан.

CNews: BI хэрэгслүүд хэр эрэлттэй байдаг вэ? Оросын компаниуд? Бизнесийн дүн шинжилгээ хийх арга барилд өөрчлөлт орсон уу: "Excel маягийн аналитик" -аас шилдэг менежерүүдийн аналитик хэрэгслийг ашиглах хүртэл?

Ольга Горчинская:

Өнөөдөр бизнесийн шинжилгээний хэрэгслүүдийн хэрэгцээ аль хэдийн нэлээд өндөр байна. Тэдгээрийг эдийн засгийн бараг бүх салбарт томоохон байгууллагууд ашигладаг. Дунд болон жижиг бизнесүүд Excel-ээс тусгай аналитик шийдэл рүү шилжихийн ач тусыг ойлгож байна.

Энэ байдлыг таван жилийн өмнөх компаниудынхтай харьцуулбал нэлээд ахиц гарч ирнэ. Сүүлийн жилүүдэд удирдагчдын нэг үе солигдсон. Мэдээллийн эрин үед карьераа хийсэн компаниудыг удирдах шинэ хүмүүс гарч ирсэн бөгөөд тэд компьютер, интернет, гар утасны төхөөрөмжийг өдөр тутмын амьдралдаа ашиглаж, ажлын асуудлыг шийдвэрлэхэд дассан.

CNews: Гэхдээ өөр төсөл байхгүй байна уу?

Ольга Горчинская:

Сүүлийн үед бид шинэ томоохон BI төслүүдийн тоо бага зэрэг буурч байгааг тэмдэглэж байна. Нэгдүгээрт, эдийн засаг, улс төрийн цогц нөхцөл байдал чухал үүрэг гүйцэтгэдэг. Барууны тогтолцоог нэвтрүүлэхтэй холбоотой зарим төслийн эхлэлийг саатуулж байна. Чөлөөт тараасан дээр суурилсан шийдлүүдийн сонирхол програм хангамжЭнэ нь програм хангамжийн сегментийг урьдчилан судлах шаардлагатай тул BI төслүүдийн эхлэлийг хойшлуулдаг. Олон Нээлттэй эхийн аналитик шийдлүүд өргөнөөр ашиглахад хангалттай төлөвшөөгүй байна.

Хоёрдугаарт, зах зээлийн тодорхой ханасан байдал аль хэдийн бий болсон. Өнөө үед бизнесийн шинжилгээг ашигладаггүй байгууллага тийм ч олон байдаггүй. Томоохон корпорацийн аналитик системийг хэрэгжүүлэхэд идэвхтэй өсөлтийн цаг өнгөрч байгаа бололтой.

Эцэст нь хэлэхэд, үйлчлүүлэгчид одоо BI хэрэгслийг ашиглахад анхаарлаа хандуулж байгаа нь бидний дассан төслүүдийн тооны өсөлтийг саатуулж байгааг анхаарах нь чухал юм. Баримт нь тэргүүлэгч ханган нийлүүлэгчид болох Oracle, IBM, SAP нар өөрсдийн BI шийдлүүдийг нэг, тууштай логик өгөгдлийн загвар дээр тулгуурлан бүтээдэг бөгөөд энэ нь аливаа зүйлийг шинжлэхийн өмнө бүх үзэл баримтлалыг тодорхой тодорхойлж, тохиролцох шаардлагатай гэсэн үг юм. үзүүлэлтүүд.

Мэдээжийн давуу талуудын зэрэгцээ энэ нь бизнесийн хэрэглэгчдийн мэдээллийн технологийн мэргэжилтнүүдээс ихээхэн хамааралтай болоход хүргэдэг: хэрэв авч үзэх хүрээнд зарим шинэ өгөгдлийг оруулах шаардлагатай бол бизнес нь өгөгдлийг татаж авах, одоо байгаатай уялдуулахын тулд мэдээллийн технологид байнга хандах шаардлагатай болдог. бүтэц, ерөнхий загварт оруулах гэх мэт d. Одоо бид бизнесүүд илүү их эрх чөлөөг хүсч байгааг харж байгаа бөгөөд шинэ бүтцийг бие даан нэмж, тэдгээрийг өөрийн үзэмжээр тайлбарлаж, дүн шинжилгээ хийх боломжтой байхын тулд хэрэглэгчид корпорацийн тогтвортой байдлын зарим хэсгийг золиослоход бэлэн байна.

Тиймээс, эцсийн хэрэглэгчдэд өгөгдөлтэй шууд ажиллах боломжийг олгож, корпорацийн түвшинд тогтвортой байдлын талаар санаа зовохгүй байх боломжийг олгодог хөнгөн хэрэгслүүд одоо гарч ирж байна. Үүний үр дүнд бид Data Discovery маягийн ажлыг идэвхжүүлдэг Tableaux болон Qlick-д амжилтанд хүрч, томоохон шийдэл нийлүүлэгчид зах зээлээ тодорхой хэмжээгээр алдаж байгааг харж байна.

CNews: Энэ нь хэд хэдэн байгууллага яагаад хэд хэдэн BI системийг хэрэгжүүлж байгааг тайлбарлаж байна - энэ нь ялангуяа санхүүгийн салбарт мэдэгдэхүйц юм. Гэхдээ ийм мэдээлэлжүүлэлтийг хэвийн гэж үзэж болох уу?


Ольга Горчинская

Өнөөдөр бидний өмнө нь аж ахуйн нэгжийн түвшинд хэтэрхий хөнгөн гэж үздэг хэрэгслүүд тэргүүлэх үүрэг гүйцэтгэж байна. Эдгээр нь Data Discovery ангиллын шийдлүүд юм.

Ольга Горчинская:

Үнэн хэрэгтээ практик дээр томоохон байгууллагууд ихэвчлэн нэг биш, хэд хэдэн бие даасан аналитик системийг ашигладаг бөгөөд тус бүр өөрийн гэсэн BI хэрэгсэлтэй байдаг. Корпорацын өргөн хүрээний аналитик загварын санаа нь бага зэрэг утопи болж хувирсан бөгөөд энэ нь тийм ч түгээмэл биш бөгөөд тэр ч байтугай аналитик технологийг сурталчлахыг хязгаарладаг, учир нь практикт хэлтэс бүр, тэр ч байтугай хувь хүн бие даасан байхыг хүсдэг; эрх чөлөө. Үүнд ямар ч аймшигтай зүйл байхгүй. Эцсийн эцэст, нэг банкинд эрсдэлийн мэргэжилтнүүд болон маркетеруудад огт өөр BI хэрэгсэл хэрэгтэй. Тиймээс, компани бүх ажилд том хэмжээний шийдэл биш, харин тусдаа хэлтэст хамгийн тохиромжтой хэд хэдэн жижиг системийг сонгох нь хэвийн үзэгдэл юм.

Өнөөдөр бидний өмнө нь аж ахуйн нэгжийн түвшинд хэтэрхий хөнгөн гэж үздэг хэрэгслүүд тэргүүлэх үүрэг гүйцэтгэж байна. Эдгээр нь Data Discovery ангиллын шийдлүүд юм. Эдгээр нь өгөгдөлтэй ажиллах энгийн байдал, хурд, уян хатан байдал, шинжилгээний үр дүнг ойлгоход хялбар байх санаан дээр суурилдаг. Ийм хэрэгслүүдийн алдар нэр өсөн нэмэгдэж буй өөр нэг шалтгаан бий: компаниуд өөрчлөгддөг бүтэцтэй, ерөнхийдөө бүтэцгүй, "бүдгэрсэн" утгатай, үргэлж тодорхой бус утгатай мэдээлэлтэй ажиллах хэрэгцээг улам бүр мэдэрч байна. Энэ тохиолдолд бизнесийн шинжилгээний сонгодог хэрэгслүүдээс илүү уян хатан хэрэгслүүд эрэлт хэрэгцээтэй байдаг.

"Форс" нь Европ дахь хамгийн том платформ, Орост цорын ганц Форс Шийдэл Төвийг бий болгосон. Үүний гол үүрэг бол ойртуулах явдал юм Хамгийн сүүлийн үеийн технологиуд Oracle нь эцсийн хэрэглэгчдэд хандан, түншүүддээ хөгжүүлэлт, хэрэглээнд нь туслах, тоног төхөөрөмж, програм хангамжийг турших үйл явцыг аль болох хүртээмжтэй болгох. Энэ бол түншүүдийн систем, үүлэн шийдлийг турших нэг төрлийн дата төв юм.

CNews: Том дата технологи нь бизнесийн аналитикийг хөгжүүлэхэд хэрхэн тусалдаг вэ?

Ольга Горчинская:

Эдгээр чиглэлүүд - том өгөгдөл ба бизнесийн аналитик - бие биедээ ойртож байгаа бөгөөд миний бодлоор тэдгээрийн хоорондох хил хязгаар аль хэдийн бүдгэрч байна. Жишээлбэл, дэвшилтэт аналитик нь Big Data гарч ирэхээс өмнө байсан ч "том өгөгдөл" гэж тооцогддог. Өнөө үед машин сургалт, статистикийн сонирхол нэмэгдэж байгаа бөгөөд эдгээр том өгөгдлийн технологийн тусламжтайгаар тооцоолол, дүрслэлд чиглэсэн уламжлалт бизнесийн системийн үйл ажиллагааг өргөжүүлэх боломжтой болсон.

Нэмж дурдахад Hadoop технологийг ашигласнаар өгөгдлийн агуулахын тухай ойлголт өргөжин тэлж, энэ нь "өгөгдлийн нуур" хэлбэрээр корпорацийн агуулахыг бий болгох шинэ стандартуудыг бий болгосон.

CNews: Том өгөгдлийн шийдлүүдийг ашигладаг хамгийн ирээдүйтэй ажлууд юу вэ?

Ольга Горчинская:

Бид BI төслүүдэд том мэдээллийн технологийг хэд хэдэн тохиолдолд ашигладаг. Эхнийх нь одоо байгаа мэдээллийн агуулахын гүйцэтгэлийг сайжруулах шаардлагатай үед бөгөөд энэ нь компаниуд ашиглаж буй мэдээллийн хэмжээ хурдацтай нэмэгдэж байгаа нөхцөлд маш чухал юм. Уламжлалт харилцааны мэдээллийн санд түүхий өгөгдлийг хадгалах нь маш үнэтэй бөгөөд боловсруулалтын хүчийг улам бүр шаарддаг. Ийм тохиолдолд Hadoop хэрэглүүрийг ашиглах нь илүү утга учиртай бөгөөд энэ нь маш сайн бүтэцтэй, уян хатан, тодорхой хэрэгцээнд дасан зохицох боломжтой, эдийн засгийн үүднээс авч үзвэл ашигтай байдаг, учир нь энэ нь Нээлттэй эхийн шийдэл дээр суурилдаг.

Ялангуяа Hadoop ашиглан бид бүтэцгүй өгөгдлийг нэг томд хадгалах, боловсруулах асуудлыг шийдсэн. Оросын банк. IN энэ тохиолдолдБид өөрчлөгдөж буй бүтэцтэй, тогтмол ирдэг их хэмжээний мэдээллийн тухай ярьж байсан. Энэ мэдээллийг боловсруулж, задлан шинжлэх, тоон үзүүлэлтүүдийг гаргаж авах, мөн анхны өгөгдлийг хадгалах ёстой. Ирж буй мэдээллийн хэмжээ ихээхэн өссөнийг харгалзан үзэхийн тулд харилцаа холбоог ашиглах нь хэтэрхий үнэтэй бөгөөд үр дүнгүй болсон. Бид боловсруулахад зориулж тусдаа Hadoop кластер үүсгэсэн анхан шатны баримт бичиг, үр дүн нь дүн шинжилгээ хийх, цаашид ашиглах зорилгоор хамаарлын хадгалах санд ачаалагддаг.

Хоёрдахь чиглэл нь BI системийн үйл ажиллагааг өргөжүүлэх дэвшилтэт аналитик хэрэгслийг нэвтрүүлэх явдал юм. Энэ нь мэдээллийн технологийн асуудлыг шийдвэрлэх төдийгүй бизнесийн шинэ боломжийг бий болгохтой холбоотой тул маш ирээдүйтэй салбар юм.

Нарийвчилсан аналитикийг хэрэгжүүлэх тусгай төслүүдийг зохион байгуулахын оронд одоо байгаа төслүүдийн цар хүрээг өргөжүүлэхийг хичээж байна. Жишээлбэл, бараг бүх системийн хувьд ашигтай функц нь боломжтой түүхэн өгөгдөл дээр үндэслэн үзүүлэлтүүдийг урьдчилан таамаглах явдал юм. Энэ нь тийм ч энгийн ажил биш бөгөөд энэ нь зөвхөн багаж хэрэгсэлтэй ажиллах ур чадвараас гадна тодорхой математикийн сургалт, статистик, эконометрикийн мэдлэг шаарддаг.

Манай компани эдгээр шаардлагыг хангасан өгөгдөл судлаачдын тусгай багтай. Тэд эрүүл мэндийн салбарт зохицуулалтын тайлан гаргах төслийг хэрэгжүүлж дууссан бөгөөд үүнээс гадна энэхүү төслийн хүрээнд ажлын ачааллыг урьдчилан тооцоолох ажлыг хэрэгжүүлсэн. эмнэлгийн байгууллагуудба тэдгээрийн сегментчилэл статистик үзүүлэлтүүд. Үйлчлүүлэгчийн хувьд ийм урьдчилсан мэдээний үнэ цэнэ нь түүний хувьд тодорхой бөгөөд энэ нь зөвхөн шинэ чамин технологийг ашиглах биш, харин аналитик чадварыг бүрэн өргөжүүлэх явдал юм. Үүний үр дүнд системийг хөгжүүлэх сонирхол нэмэгдэж, бидний хувьд шинэ ажил бий болж байна. Одоо бид ижил төстэй байдлаар урьдчилан таамаглах аналитик технологийг хотын менежментийн төсөлд хэрэгжүүлж байна.

Эцэст нь бид бүтэцгүй өгөгдөл, ялангуяа янз бүрийн текст баримт бичгийг ашиглах тухай ярьж байгаа том мэдээллийн технологийг хэрэгжүүлэх туршлагатай. Интернэт нь бизнест хэрэгтэй мэдээллийг агуулсан асар их хэмжээний бүтэцгүй мэдээллээр агуу боломжуудыг санал болгодог. Маш сонирхолтой туршлагаБид хүсэлтийн дагуу ROSECO компанийн үл хөдлөх хөрөнгийн үнэлгээний системийг боловсруулахтай холбоотой байсан. Оросын нийгэмүнэлгээчид. Аналог объектуудыг сонгохын тулд систем нь интернет дэх эх сурвалжаас мэдээлэл цуглуулж, хэл шинжлэлийн технологийг ашиглан эдгээр мэдээллийг боловсруулж, машин сургалтын аргыг ашиглан гео-аналитик ашиглан баяжуулсан.

CNews: Force бизнесийн аналитик болон том мэдээллийн салбарт ямар өмчийн шийдлүүдийг боловсруулдаг вэ?

Ольга Горчинская:

Бид том өгөгдлийн салбарт тусгай шийдэл болох ForSMedia-г боловсруулж, хөгжүүлж байна. Энэ нь хэрэглэгчийн мэдлэгийг баяжуулах нийгмийн мэдээллийн мэдээллийн аналитик платформ юм. Үүнийг янз бүрийн салбарт ашиглаж болно: санхүүгийн салбар, харилцаа холбоо, жижиглэн худалдаа - үйлчлүүлэгчдийнхээ талаар аль болох ихийг мэдэхийг хүссэн газар бүрт.


Ольга Горчинская

Бид том өгөгдлийн салбарт тусгай шийдэл болох ForSMedia-г боловсруулж, хөгжүүлж байна. Энэ нь хэрэглэгчийн мэдлэгийг баяжуулах нийгмийн мэдээллийн мэдээллийн аналитик платформ юм.

Ердийн хэрэглээний тохиолдол бол зорилтот маркетингийн кампанит ажлыг хөгжүүлэх явдал юм. Хэрэв компани 20 сая хэрэглэгчтэй бол бүгдийг нь тараа зар сурталчилгааМэдээллийн сангаас харахад энэ нь бодитой бус юм. Та зар хүлээн авагчдын тойргийг нарийсгах хэрэгтэй, мөн зорилгын функцэнд - хэрэглэгчийн хариуг нэмэгдүүлэх маркетингийн санал. Энэ тохиолдолд бид бүх үйлчлүүлэгчдийн талаархи үндсэн мэдээллийг (нэр, овог, төрсөн огноо, оршин суугаа газар) ForSMedia-д байршуулж, дараа нь нийгмийн сүлжээн дэх мэдээлэлд үндэслэн тэдгээрийг шинэ хэрэгцээтэй мэдээллээр, түүний дотор ашиг сонирхлын хүрээ, нийгмийн байдал, гэр бүлийн бүтэц, бүс нутаг мэргэжлийн үйл ажиллагаа, хөгжмийн сонголт гэх мэт. Мэдээжийн хэрэг, ийм мэдлэгийг бүх үйлчлүүлэгчид олж чадахгүй, учир нь тэдний тодорхой хэсэг нь нийгмийн сүлжээг огт ашигладаггүй, гэхдээ зорилтот маркетингийн хувьд ийм "бүрэн бус" үр дүн нь асар их давуу талыг өгдөг.

Олон нийтийн сүлжээажиллахад хэцүү ч гэсэн маш баялаг эх сурвалж юм. Хэрэглэгчдийн дунд хүнийг тодорхойлох нь тийм ч хялбар биш юм - хүмүүс ихэвчлэн нэрийнхээ янз бүрийн хэлбэрийг ашигладаг, нас, сонголтыг заадаггүй бөгөөд түүний нийтлэл, захиалгын бүлгүүдэд үндэслэн хэрэглэгчийн шинж чанарыг олж мэдэх нь тийм ч хялбар биш юм.

ForSMedia платформ нь том дата технологид суурилсан эдгээр бүх асуудлыг шийдэж, хэрэглэгчийн мэдээллийг их хэмжээгээр баяжуулж, үр дүнд дүн шинжилгээ хийх боломжийг олгодог. Ашигласан технологид Hadoop, R статистик судалгааны орчин, RCO хэл шинжлэлийн боловсруулалтын хэрэгсэл, Мэдээлэл илрүүлэх хэрэгслүүд орно.

ForSMedia платформ нь чөлөөтэй тархсан програм хангамжийг дээд зэргээр ашигладаг бөгөөд бизнесийн даалгаврын шаардлагад нийцсэн ямар ч техник хангамжийн платформ дээр суулгаж болно. Харин томоохон хэрэгжилтМөн гүйцэтгэлийн шаардлагыг нэмэгдүүлэхийн тулд бид Oracle-ийн техник хангамж, програм хангамжийн системүүд дээр ажиллахад зориулагдсан тусгай хувилбарыг санал болгож байна – Oracle Big Data Appliance болон Oracle Exalytics.

Томоохон төслүүдэд шинэлэг нэгдсэн Oracle цогцолборуудыг ашиглах нь зөвхөн аналитик системийн салбарт төдийгүй бидний үйл ажиллагааны чухал чиглэл юм. Ийм төслүүд нь хямдхан биш боловч шийдэгдэж буй ажлуудын цар хүрээний улмаас бүрэн үндэслэлтэй юм.

CNews: Хэрэглэгчид худалдан авах шийдвэр гаргахаасаа өмнө эдгээр системийг ямар нэгэн байдлаар туршиж болох уу? Жишээлбэл, та туршилтын вандан сандал өгдөг үү?

Ольга Горчинская:

Энэ чиглэлд бид зөвхөн туршилтын вандан сандал өгөхгүй, Европ дахь хамгийн том, Орост цорын ганц платформ болох Fors Solution Center-ийг бий болгосон. Үүний гол зорилго нь Oracle-ийн хамгийн сүүлийн үеийн технологийг эцсийн хэрэглэгчдэд ойртуулах, түншүүддээ хөгжүүлэлт, хэрэглээнд нь туслах, тоног төхөөрөмж, программ хангамжийг турших үйл явцыг аль болох хүртээмжтэй болгох явдал юм. Энэ санаа гэнэт гараагүй. Force нь бараг 25 жилийн турш Oracle технологи, платформ дээр суурилсан шийдлүүдийг боловсруулж, хэрэгжүүлсээр ирсэн. Бид үйлчлүүлэгчид болон түншүүдтэй хамтран ажиллаж байсан арвин туршлагатай. Үнэн хэрэгтээ "Хүч" бол Орос дахь Oracle-ийн чадамжийн төв юм.

Энэ туршлагыг харгалзан үзээд 2011 онд Oracle Exadata мэдээллийн сангийн хөдөлгүүрийн анхны хувилбарууд гарч ирэхэд бид эдгээр системийг эзэмших анхны лабораторийг байгуулж, үүнийг ExaStudio гэж нэрлэсэн. Үүний үндсэн дээр олон арван компаниуд Exadata программ хангамж, техник хангамжийн шинэ шийдлүүдийн боломжийг нээж чадна. Эцэст нь 2014 онд бид үүнийг систем, үүлэн шийдлийг турших нэг төрлийн дата төв болгон хувиргасан - энэ бол Fors Solution Center юм.

Одоо манай төв нь Exadata болон Exalogic-аас эхлээд Big Data Appliance хүртэл хамгийн сүүлийн үеийн Oracle программ хангамж, техник хангамжийн системийг бүрэн хэмжээгээр танилцуулж байна. Туршилтаас гадна мэдээллийн системд аудит хийх, шинэ платформ руу шилжих, тохируулах, тохируулах, масштаблах үйлчилгээг эндээс авах боломжтой.

Тус төв нь үүлэн технологи ашиглах чиглэлээр идэвхтэй хөгжиж байна. Тун удалгүй тус төвийн архитектурыг үүлэн дээр тооцоолох нөөц, үйлчилгээгээ хангах үүднээс өөрчилсөн. Одоо үйлчлүүлэгчид өөрөө өөртөө үйлчлэх бүтээмжийн чадавхийг ашиглах боломжтой: туршилтын өгөгдөл, програмуудыг байршуулж, үүлэн орчинд туршилт хийх.

Үүний үр дүнд түнш компани эсвэл үйлчлүүлэгч өөрийн нутаг дэвсгэрт байгаа тоног төхөөрөмж, туршилтын төслүүдэд урьдчилж хөрөнгө оруулалт хийхгүйгээр манай клоуд руу өөрийн программыг байршуулж, туршилт хийж, гүйцэтгэлийн үр дүнг харьцуулж, шинэ платформ руу шилжих шийдвэр гаргах боломжтой.

CNews: Хамгийн сүүлчийн асуулт бол Oracle Day дээр юу бэлэглэх вэ?

Ольга Горчинская:

Oracle Day нь корпораци болон түүний бүх түншүүдийн хувьд Орос улсад энэ жилийн гол арга хэмжээ юм. “Force” олон удаа түүний ерөнхий ивээн тэтгэгчээр ажиллаж байсан бөгөөд энэ жил ч мөн адил. Форум нь бүхэлдээ үүлэн сэдвүүдэд зориулагдсан болно - PaaS, SaaS, IaaS, Oracle эдгээр технологид ихээхэн анхаарал хандуулдаг тул Oracle Cloud Day болгон зохион байгуулагдах болно.

Энэ үеэр бид ForSMedia платформоо танилцуулахаас гадна бизнесийн аналитикийн чиглэлээр том дата технологи, төслүүдийг ашиглах туршлагаасаа ярих болно. Мэдээжийн хэрэг, бид үүлэн шийдлийг бий болгох чиглэлээр манай Fors Solution төвийн шинэ боломжуудын талаар танд хэлэх болно.