Modeli i të dhënave

modeli abstrakt për organizimin e të dhënave

Një model i të dhënave paraqet një model abstrakt që rëndit komponentët e të dhënave dhe standardizon formën se si ato ndërlidhen me njëra-tjetren dhe me karakteristikat e entiteteve të botës reale.[1][2] Marrim shembull, një model i të dhënave ka mundësi të specifikojë që komponenti i të dhënave që përfaqëson një makinë të përbëhet nga një sasi e caktuar komponentesh të tjerë të cilët, nga këndvshtrimi tjetër, demonstrojnë ngjyrën dhe përmasat e makinës dhe caktojnë pronarin e saj.

Përmbledhje e përgjithshme e një konteksti të modelimit të të dhënave: Modeli i të dhënave fokusohet në të dhënat, marrëdhëniet e të dhënave, semantiken e të dhënave dhe kufizimin e tyre. Një model i të dhënave ofron detaje të informacionit që do të ruhet dhe është i përdorimit primar, kur produkti final është gjenerimi i kodit të softuerit kompjuterik për një program ose krijimi i një specifikimi funksional për të ndihmuar vendimin për marrjen ose blerjen e një softueri kompjuterik . Figura paraqet një shembull të ndërveprimit mes modeleve të procesit dhe të dhënave.

Aktiviteti përkatës profesional quhet kryesisht modelimi i të dhënave ose, më saktësisht, dizajnimi i bazës së të dhënave . Modelet e të dhënave kryesisht përcaktohen nga një specilist i të dhënave, ekspert i të dhënave, shkencëtar i të dhënave, bibliotekar i të dhënave ose një studiues i të dhënave. Një gjuhë e modelimit të të dhënave dhe shkrimet, në shumicën e rasteve paraqiten në menyrë grafike si diagrame.[3]

Një model të dhënash në disa raste ka mundësi të referohet si një strukturë e të dhënave, sidomos në kuadër të gjuhëve programuese . Modelet e të dhënave mjaft herë përmbushen me modele funksioni, në veçanëri në përmbajtjen e modeleve të ndërmarrjeve.

Një model i të dhënave në mënyrë të veçantë specifikon në formë eksplicite strukturën e të dhënave ; përkundrazi, të dhënat e strukturuara janë informacione të rënditura me anë të një modeli të kuptueshem të të dhënave ose strukturës së të dhënave. Të dhënat e strukturuara qëndrojnë në kontrast me të dhënat e pastrukturuara dhe të dhënat gjysmë të strukturuara.

Vështrim i përgjithshëm

Redakto

Koncepti model i të dhënave ka mundësi t'i referohet dy prespektivave të ndryshme nga njëra-tjetra, por të integrura ngushtë. Nganjëherë i referohet një definimi abstrakt të objekteve dhe raportet që gjenden në një sferë të veçantë aplikimi: për ilustrim përdoruesit, produktet dhe urdhërat që gjenden në një organizatë prodhuese. Në situata të tjera ai i referohet grupit të koncepteve të parimeve në caktimin e definimeve të tilla: marrim shembull nocione të tilla si entitete, atribute, marrëdhënie ose tabela. Domethënë, "modeli i të dhënave" i një aplikacioni bankar mund të përcaktohet duke shfrytëzuar "modelin e të dhënave" entitet-marrëdhënie. Artikulli e përdor termin në dy kuptime.

Administrimi i numrit të madh të të dhënave të strukturuara dhe të pastrukturuara paraqet një funksion primar të sistemeve të informacionit . Modelet e të informacioneve shpjegojnë skemën, menaxhimin dhe elementet e sigurisë të të dhënave të mbajtura në sistemet e organizimit të të dhënave siç janë regjistrat e të dhënave relacionale. Ata gjithashtu kan mundësi të interpretojnë të dhëna me një formë më të lirshme, të tilla si dokumentet e përpunimit të tekstit, mesazhet e postës elektronike, fotografitë, audio dixhitale dhe video: XDM, si shembull, na ofron qasje në një model të dhënash për dokumentet XML.

Roli i modeleve të të dhënave

Redakto
 
Si arrijnë të sjellin përfitime modelet e të dhënave

Synimi themelor i strukturave të të dhënave është të asistojnë formimin e sistemeve të informacionit duke ofruar definicionin dhe tipin e të dhënave. Sipas West dhe Fowler (1999) "nëse kjo bëhet në mënyrë të qëndrueshme nëpër sisteme, atëherë mund të realizohet përpshtatja e të dhënave. Nëse të njëjtat struktura të dhënash shfrytëzohen për të ruajtur dhe aksesuar të dhënat, atëherë aplikacione të ndryshme mund të shpërndajnë të dhëna. Konkluzionet e kësaj janë cekur më lart. Megjithëse, sistemet dhe ndërfaqet shpesh kushtojnë më shumë seç është e nevojshme, për të krijuar, funksionuar dhe mirëmbajtur ato poashtu mund të kufizojnë biznesin sesa ta mbështesin atë ndërfaqet janë të dobëta".

  • "Normat e biznesit, të veçanta për mënyrën se si zbatohen gjërat në një zonë të caktuar, zakonisht fiksohen në formën e një modeli të dhënash. Kjo nënkupton se dallimet e vogla në mënyrën se si drejtohet biznesi rezulton në ndryshime të mëdha në sistemet kompjuterike dhe ndërfaqet".
  • "Llojet e subjekteve zakonisht nuk përcaktohen, ose identifikohen gabimisht. Kjo mund të rezultojë në përsëritjen e të dhënave, strukturës së të dhënave dhe kapacitetit, së bashku me shpenzimet shoqëruese të atij dyfishimi në zhvillim dhe mirëmbajtje".[4]
  • "Modelet e të dhënave për sisteme të ndryshme,mund të jenë në formë arbitrare të ndryshme. Përfundimi i kësaj është se lidhje të ndërlikuara kërkohen midis sistemeve që ndajnë të dhëna. Këto ndërfaqe mund të përbëjnë midis 25-70% të kostos së sistemeve aktuale".[4]
  • "Të dhënat nuk mund të shpërndahen në mënyrë elektronike me konsumatorët dhe ofruesit, meqënëse struktura dhe kuptimi i të dhënave nuk është normalizuar. Si shembull, të dhënat e projektimit inxhinierik dhe vizatimet për impiantin e procesit ende shkëmbehen herë pas herë në letër".[4]

Shkaku për këto probleme është mungesa e standardeve që do të ofrojnë siguri në mënyrë që modelet e të dhënave të plotësojne kërkesat e biznesit dhe të jenë të qëndrueshme.

Një model i të dhënave cakton në formë eksplicite organizimin e të dhënave. Aplikimet tipike të modeleve të të dhënave përfshijnë kryesisht modelet e bazës së të dhënave, projektimin e sistemeve të informacionit dhe mundësimin që ato të shkëmbehen mes vete. Kryeisht, modelet e të dhënave përcaktohen në një gjuhë modelimi të të dhënave.[3]

Tre këndvështrime

Redakto
 
Arkitektura ANSI/SPARC me tre nivele . Kjo shpjegon se një model i të dhënave ka mundësi të jetë një model (ose pamje) i jashtëm, një model konceptual ose një model fizik. Kjo nuk paraqet mënyrën e vetme për të parë modelet e të dhënave, por është një mënyrë e dobishme, sidomos kur krahasojmë modelet.

Këtu paraqitet një shembull i modelit të të dhënave ka mundësi të jetë njëri nga tre tipet sipas ANSI në 1975:

  1. Modeli konceptual i të dhënave : shpjegon kuptimin e një domeni, duke qenë synimi i modelit. Si shembull, mund të jetë një model i fushës së interesit të një organizate apo industrie. Ky përbëhet nga klasa entiteti, që përfaqësojnë kategori të gjërave me rëndësi në domen, dhe deklarata marrëdhëniesh rreth lidhjeve midis çifteve të klasave të njësive. Një strukturë konceptuale specifikon llojet e fakteve ose sugjerimeve që mund të shprehen duke shfrytëzuar modelin. Në këtë kuptim, ai cakton shprehjet e lejuara në një 'gjuhë' artificiale me një shtrirje që kufizohet nga shtrirja e modelit.
  2. Modeli logjik i të dhënave : përshkruan semantikën, siç përfaqësohet nga një teknologji e veçantë e manipulimit të të dhënave. Ky përbëhet nga definime të tabelave dhe kolonave, klasave të drejtuara drejt objekteve dhe etiketave XML, ndër të tjera.
  3. Modeli i të dhënave fizike : përshkruan mjetet fizike me të cilat ruhen të dhënat. Kjo ka të bëjë me ndarjet, CPU-të, hapësirat e tabelave dhe të përafërta.

Rëndësia e kësaj qasjeje, sipas ANSI, qëndron te fakti se ajo e bën të mundur që të tre perspektivat të jenë relativisht të lira nga njëra-tjetra. Teknologjia e ruajtjes ka mundësi të ndryshojë pa pasur ndikim as në modelin logjik dhe as në modelin konceptual. Struktura e tabelës/kolonës mund të ketë ndryshime pa prekur (domosdoshmërisht) modelin konceptual. Në secilin rast, natyrisht, strukturat duhet të qëndrojnë në përputhueshmëri me modelin tjetër. Struktura e tabelës/kolonës mund të dallojë nga një përkthim i drekt i klasave dhe atributeve të entitetit, por përfundimisht duhet të plotësojë qëllimet e strukturës konceptuale të klasës së entitetit. Fazat fillestare të shumë projekteve të zhvillimit të softuerit theksojnë hartimin e një modeli konceptual të të dhënave . Një dizajn i tillë mund të përshkruhet në një model të dhënash logjike . Në fazat e mëvonshme, ky model mund të përkthehet në modelin e të dhënave fizike . Megjithatë, është poashtu e mundur të aplikohet drejtpërdrejt një model konceptual.

Historia

Redakto

Njëra ndër detyrat më të hershme novatore në modelimin e sistemeve të informacionit u realizua nga Young dhe Kent (1958), të cilët debatuan për "një mëtodë të qartë dhe abstrakte për të përcaktuar aspektet informative dhe kohore të një problemi të përpunimit të të dhënave ". Qëllimii tyre ishe krijimi i "një formati që duhet t'i mundësojë analistit të strukturojë çështjen bazuar ne çdo komponent të harduerit ". Kjo punë shënoi përpjekjen parësore për të formuar një specifikim abstrakt dhe parim të pandryshueshëm për dizajnimin e aplikimeve të ndryshme alternative duke përdorur elementë të ndryshëm harduerikë. Hapi tjetër në modelimin e IS u ndërmor nga CODASYL, një konsorcium i industrisë së IT-së i cili ishte formuar në vitin 1959, i cili në thelb kishte qëllim të njëjtën gjë si Young dhe Kent: zhvillimin e "një strukture të duhur për gjuhën e përcaktimit të problemit të pavarur nga makina, në nivel sistemi. të përpunimit të të dhënave”. Kjo çoi në krijimin e një algjebre specifike të informacionit IS.[5]

Në vitet 1960, strukturimi i të dhënave fitoi më shumë rëndësi me inicimin e konceptit të sistemit të informacionit të menaxhimit (MIS). Sipas Leondes (2002), "gjatë asaj kohe, sistemi i informacionit ofronte siguri ndaj të dhënave dhe informacionit për synime administrative. Sistemi i bazës së të dhënave të gjeneratës së parë, i quajtur Integrated Data Store (IDS), u projektua nga amerikani Charles Bachman në General Electric. Dy koleksione të organizuara të të dhënave që kishin fituar mjaft popullaritet Modelet, modeli i të dhënave të rrjetit dhe modeli i të dhënave hierarkike, u sugjeruan gjatë këtij intervali kohor”. Nga fundi i viteve 1960, Edgar F. Codd përpunoi hipotezat e tij të rregullimit të të dhënave dhe modifikoi modelin relacional i cili shërbente për menaxhimin e bazës së të informacioneve duke u bazuar në logjikën e kallëzuesit të rendit të parë.

Në vitet 1970, modelimi entitet-marrëdhënie u zbulua si një formëe re e modelimit konceptual të të dhënave, i konfirmuar së pari në 1976 nga Peter Chen . Modelet entitet-marrëdhënie u shfrytëzuan në fazën e parësore të dizajnimit të sistemit të informacionit gjatë analizës së kërkesave për të përshkruar kërkesat informative ose llojin e informacionit që do të ruhej në një bazë të dhënash . Kjo metodë mund të shpjegojë çdo ontologji, p.sh., një përmbledhje dhe kategorizm të parimeve dhe raporteve të tyre, për një fushë të caktuar interesi.

Në vitet 1970, GM Nijssen zhvilloi metodën "Natural Language Information Analysis Method" (NIAM) dhe e zhvilloi këtë përgjatë vitetve të '80 në kolaborim me Terry Halpin në Modelimin e Rolit të Objekteve (ORM). Megjithatë, ishte deklarata e doktoraturës e Terry Halpin e vitit 1989 ajo që formoi bazen formale mbi të cilin fokusohet Modelimi Objekt-Role.

Bill Kent, në librin e tij të vitit 1978 Të dhënat dhe realiteti, [6] krahasoi një model të dhënash me një hartë të një territori, duke veçuar se në botën reale, "autostradat nuk janë të pikturuara me ngjyrë të kuqe, lumenjtë nuk kanë linja rrethore të cilat shkojnë në mes., dhe nuk ka mundësi të shohësh linja kufitare në një mal”. Ndryshe nga studiues të tjerë që tentuan të formonin modele që ishin matematikisht të sakta dhe estetikisht të bukura, Kent veçoi kaosin thelbësore të botës reale dhe punën e modeluesit të të dhënave për të krijuar radhë nga kaosi pa e shtrembëruar tepër të vërtetën.

Në vitet 1980, sipas Jan L. Harrington (2000), "zhvillimi i paradigmës së orientuar nga objekti solli një transformimin themelor në mënyrën se si i shohim të dhënat dhe proceset që veprojnë mbi të dhënat. Në mënyrë konvencionale, të dhënat dhe proceset kanë qenë të ruajtura në formë të veçuar: të dhënat dhe raporti i tyre në një bazë të dhënash, procedurat në një program aplikimi, mirëpo, kombinuan procedurën e një entiteti me të dhënat që i përkasin atij.

Gjatë viteve të hershme të 1990, tre matematikanë të cilët ishin holandezë Guido Bakema, Harm van der Lek dhe JanPieter Zwart, vijuan zhvillimin e punës së GM Nijssen . Ata u përqendruan më shumë në porcionin e komunikimit të domethënies. Në vitin 1997 ata arritën të regjistrojnë teknikën e Modelimit të Informacionit të Orientuar plotësisht në Komunikim FCO-IM.

Llojet

Redakto

Modeli i bazës së të dhënave

Redakto

Një model i bazës së të dhënave paraqet një specifikim që shpjegon se si formohet dhe shfrytezohet një bazë të dhënash.

Janë propozuar një numër modelesh të tilla. Modelet e zakonshme përmbajnë:

Modeli i sheshtë
Ky mund të mos kualifikohet rreptësisht si një model i të dhënave. Modeli i sheshtë (ose i tabelës) përbëhet prej një grupi të vetëm, dy-dimensional i komponentëve të të dhënave, ku të gjithë pjesëmarrësit e një kolone të caktuar priten të jenë vlera të ngjashme dhe të gjithë pjesëmarrësit e një rreshti supozohet se janë të ndërlidhur me njëri-tjetrin.
Modeli hierarkik
Modeli hierarkik është i ngjashëm me modelin e rrjetit, përveç se lidhjet në modelin hierarkik krijojnë një skemë peme, përkundrazi modeli i rrjetit lejon grafikun arbitrar.
Modeli i rrjetit
Ky model planifikon të dhënat duke shfrytëzuar dy konstruksione thelbësore, të cilat janë rekordet dhe grupet. Regjistrimet përfshijnë fusha, dhe grupet përcaktojnë marrëdhënie një-me-shumë ndërmjet rekordeve: një pronar, shumë anëtarë. Modeli i të dhënave të rrjetit është një abstraksion i konceptit të projektimit të përdorur në aplikimin e bazave të të dhënave.
Modeli relacional
është një model bazë të dhënash qe bazohet në logjikën e kallëzuesit të rendit të parë. Parimi i saj thelbësore është të përshkruajë një bazë të dhënash si një koleksion kallëzuesish mbi një grup të kufizuar variablash kallëzues, duke shpjeguar kufizimet në vlerat e mundshme dhe kombinimet e vlerave. Fuqia e modelit të të dhënave relacionale qëndron në themelet e tij matematikore dhe në një paradigmë të thjeshtë të nivelit të klientit.
Modeli objekt-relacion
Ngjashëm me një model të bazës së të dhënave relacionale, mirëpo objektet, klasat dhe trashëgimia mbështeten në mënyrë direkte në skemat e bazës së të dhënave dhe në gjuhën e pyetjes.
Modelimi i rolit të objektit
Një metodë e modelimit të të dhënave që është caktuar si "pa atribute" dhe "e bazuar në fakte". Rezultati paraqet një sistem të saktë ,të verifikueshëm, nga i cili është e mundur të rrjedhin objekte të tjera të zakonshme, si ERD, UML dhe modelet semantike. Lidhjet ndërmjet objekteve të të dhënave përshkruhen gjatë procesit së projektimit të bazës së të dhënave, të tilla që normalizimi është një rezultat përfundimtar i pashmangshëm i procedurës.
Skema e yjeve
Tipi më i thjeshtë i skemës së magazinës së të dhënave. Skema e yjeve përmban disa "tabela faktesh" (ndoshta vetëm një, që justifikon emrin) që i referohet çdo numri "tabelash të dimensioneve". Skema e yjeve është i vlerësuar si një rast i rëndësishëm i veçantë i skemës së flokeve të borës.

Diagrami i strukturës së të dhënave

Redakto
 
Shembull i një diagrami të strukturës së të dhënave

Një diagram i strukturës së të dhënave (DSD) paraqet një diagram dhe model i të dhënave që shfrytëzohet për të përshkruar modelet konceptuale të të dhënave duke siguruar paraqitje grafike të cilat dokumentojnë entitetet dhe marrëdhëniet e tyre, dhe kufizimet që i lidhin ato. Komponentet kryesorë grafike të DSD-ve janë kutitë, që në mënyrë simboleke paraqesin entitetet, dhe shigjetat, që cilat tregojnë raportet. Diagramet e strukturës së të dhënave janë veçanërisht të dobishme për të dokumentuar entitete komplekse të të dhënave.

Diagramet e strukturës së të dhënave janë një zgjerim e modelit të marrëdhënies entitet (modeli ER). Në DSD, atributet përcaktohen brenda kutive të entitetit dhe jo jashtë tyre, përderisa marrëdhëniet parqiten si kuti të përbëra nga atribute të cilat përcaktojnë kufizimet që ndërlidhin entitetet së bashku. DSD-të dallojnë nga modeli ER në atë që modeli ER fokusohet në marrëdhëniet në mes të njësive të ndryshme, ndërsa DSD-të përqendrohen në marrëdhëniet e komponentëve në brendësi të një entiteti dhe u mundësojnë klientëve të shohin plotësisht lidhjet dhe raportet midis secilit entitet.

Ekzistojnë disa qasje për ilustrimin e diagrameve të strukturës së të dhënave, me transformimin e dukshëm në mënyrën e përcaktimit të kardinalitetit . Zgjedhjet ndodhen ndërmjet kokave të shigjetave, kokave të përmbysura të shigjetave ( këmbët e sorrës ) ose paraqitjes të kardinalitetit në formë numerike.

 
Shembull i diagrameve të një entiteti-lidhje IDEF1X të përdorur për të modeluar vetë IDEF1X [7]

Modeli i marrëdhënies entitet

Redakto

Një model i lidhjeve midis entiteteve (ERM), i quajtur nganjëherë si një diagram i raporteve entitet (ERD), mund të shfrytëzohet për të përfaqësuar një model abstrakt të të dhënave konceptuale (ose model të dhënash semantike ose model të dhënash fizike) të përdorur në inxhinierinë softuerike për të përfaqësuar të dhëna të strukturuara . Ekzistojnë disa shënime të përdorura për ERM-të. Ashtu si DSD-të, atributet përshkruhen në brendësi të kutive të entitetit dhe jo jashtë tyre, ndërsa marrëdhëniet vizatohen si linja, me kufizimet e tyre të shpjeguara përgjatë linjave.Megjithëse Modeli ER është i fuqishëm, mund të bëhet vizualisht i rëndë kur përfaqëson entitete me disa atribute.

Ekzistojnë disa qasje për ilustrimin e diagrameve të strukturës së të dhënave, me një dallim të qartë në mënyrën e shprehjes të kardinalitetit. Opsionet përfshijnë përdorimin e majave të shigjetave, kokave të përmbysura të shigjetave (këmbët e sorrës) ose paraqitjes numerike të kardinalitetit.

Modeli i të dhënave gjeografike

Redakto

Një model i të dhënave në sistemet e informacionit gjeografik është një koncept matematik për demonstrimin e objekteve apo sipërfaqeve gjeografike si të dhëna. Si shembull,

  • modeli i të dhënave vektoriale paraqet gjeografinë si pika, vija dhe poligone të ndryshme
  • modeli i të dhënave raster paraqet gjeografinë si matrica qelizash që sigurojnë vlerat numerike;
  • dhe modeli i të dhënave të rrjetit të parregullt të trekëndëshuar (TIN) përfaqëson gjeografinë si kategori trekëndëshash të lidhur, jo të mbivendosur.

Modeli i të dhënave gjenerike

Redakto

Modelet e informacionit të përgjithshëm janë deklarime të strukturave konvencionale të të dhënave. Ato caktojnë kategoritë e standardizuara të marrëdhënieve universale, së bashku me llojet e elementeve që kanë mundësi të lidhen me një formë të tillë lidhjeje. Modelet e të dhënave gjenerike janë projektuar si metodë për të zgjidhur disa mangësi të modeleve konvencionale të të dhënave. Marrim shembull, analistë të ndryshëm kryesisht prodhojnë modele të ndryshme konvencionale të të dhënave të të njëjtit domen. Kjo mund të rezultojë në vështirësi në bashkimin e modeleve të njerëzve të ndryshëm dhe paraqet një pengesë për shkëmbimin e të dhënave dhe integrimin e të dhënave. Edhe pse, ky ndryshim i atribuohet nivelit të ndryshëm të përgjithësimit në strukturave dhe ndryshimeve në llojet e fakteve që mund të ilustrohen (aftësitë e shprehjes semantike të modeleve). Modeluesit duhet të bashkëbisedojnë dhe të arrijnë marrëveshje për disa komponentë që duhet të jepen më të detajuara, me qëllim që dallimet t'i bëjnë më pak të rëndësishme.

Modeli i të dhënave semantike

Redakto
 
Modelet e të dhënave semantike [7]

Një strukturë semantike në inxhinierinë e programeve kompjuterike përfqëson një qasje për të caktuar kuptimin e informacionit në brendësi të kontekstit të ndërlidhjeve të tyre me të dhëna të tjera. Një model i të dhënave semantike është një abstraksion që përcakton mënyrën se si simbolet e ruajtura lidhen me botën reale.[7] Një model i të dhënave semantike ndonjëherë quhet model konceptual i të dhënave.

Struktura logjike e informacionit të një sistemi të menaxhimit të bazës së të dhënave (DBMS), qoftë hierarkike, rrjetore apo relacionale, nuk arrin të përmbushë plotësisht kërkesat për një definim konceptual të të dhënave, sepse ajo është e kufizuar në hapësirë dhe e njëanshme ndaj qasjeve së aplikimit të përdorur nga DBMS. Për këtë arsye, kërkesa për të përcaktuar të dhënat nga një këndvështrim konceptual ka rezultuar në zhvillimin e teknikave të modelimit të të dhënave semantike. Kjo nënkupton përdorimin e metodave për të definuar kuptimin e informacion brenda kontekstit të marrëdhënieve të tyre me të dhëna të tjera. Siç demonstrohet në figurë, realiteti konkret për sa i përket burimeve, ideve, ngjarjeve, etj., shprehet në mënyrë simbolike brenda dyqaneve fizike të të dhënave. Një model i të dhënave semantike është një abstraksion që përcakton se si simbolet e ruajtura lidhen me botën reale. Kështu, modeli duhet të jetë një përfaqësim i vërtetë i botës reale.[7]

Arkitektura e të dhënave

Redakto

Arkitektura e të dhënave është projektimi i strukturave të të dhënave për t'u përdorur në përcaktimin e pozitës së dëshiruar dhe planifikimin pasues të nevojshëm për të arritur gjendjen e synuar. Kryesisht është një nga disa fusha të arkitekturës që krijojnë shtyllat e arkitekturës së ndërmarrjes ose arkitekturës së zgjidhjeve.

Një arkitekturë e të dhënave paraqet strukturat e të dhënave të shfrytëzuara nga një organizatë dhe/ose sistemet e saj. Ajo përfshin përshkrime të të dhënave në ruajtje dhe të dhënave në lëvizje; përshkrimet e ruajtjes së të dhënave, kategorive të të dhënave dhe artikujve të të dhënave; dhe hartimin e këtyre artefakteve të të dhënave me karateristikat e të dhënave, sistemet, vendndodhjet, etj.

Themelore për arritjen e gjendjes së synuar, arkitektura e të dhënave shpjegon se si të dhënat modifikohen, ruhen dhe përdoren në një sistem të caktuar. Ajo ofron kriteret për operacionet e përpunimit të të dhënave që ofrojnë qasje te projektim i rrjedhave të të dhënave dhe poashtu kontrollin e rrjedhës së të dhënave në sistem.

Modelimi i të dhënave

Redakto
 
Procesi i modelimit të të dhënave

Modelimi i të dhënave në inxhinierinë softuerike është procedura e krijimit të një modeli të dhënash duke zbatuar përshkrime formale të modelit të të dhënave duke përdorur teknikat e modelimit të të dhënave. Modelimi i të dhënave është një metodë për përcaktimin e kërkesave të biznesit për një bazë të dhënash. Ndonjëherë quhet modelimi i bazës së të dhënave meqënëse një model i të dhënave përfundimisht zbatohet në një bazë të dhënash.

Figura demonstron mënyrën se si modelet e të dhënave krijohen dhe përdoren sot. Një model konceptual i të dhënave zhvillohet duke u bazuar në kërkesat e të dhënave për aplikacionin që po zhvillohet, ndoshta në kontekstin e një modeli aktiviteti . Modeli i të dhënave normalisht do të përfshijë llojet e entiteteve, atributet, marrëdhëniet, rregullat e integritetit dhe përkufizimet e atyre objekteve. Kjo më pas përdoret si pikënisje për dizajnin e ndërfaqes ose bazës së të dhënave.

Karakteristikat e të dhënave

Redakto
 
Disa veti të rëndësishme të të dhënave

Disa veti të rëndësishme të të dhënave për të cilat duhet të përmbushen kërkesat janë:

  • vetitë e lidhura me përkufizimin
    • rëndësia : dobia e të dhënave në kontekstin e biznesit tuaj.
    • qartësi : disponueshmëria e një definimi të qartë dhe të përbashkët për të dhënat.
    • qëndrueshmëri : konsistenca e të njëjtit lloj të dhënash nga burime të ndryshme.
  • vetitë e lidhura me përmbajtjen
    • kohëzgjatja : disponueshmëria e të dhënave në kohën e nevojshme dhe sa të përditësuara janë ato të dhëna.
    • saktësia : sa afër të vërtetës janë të dhënat.
  • vetitë që lidhen me përkufizimin dhe përmbajtjen
    • plotësia : sa nga të dhënat e kërkuara janë në disponueshmëri.
    • aksesueshmëria : ku, si dhe kujt janë të disponueshme ose jo të disponueshme të dhënat (p.sh. siguria).
    • kosto : kostoja e shkaktuar për marrjen e të dhënave dhe vënien e tyre në dispozicion për shfrytëzim.

Organizimi i të dhënave

Redakto

Një tip tjetër i skemës së të dhënave përshkruan se si të rënditen të dhënat duke përdorur një sistem të menaxhimit të bazës së të dhënave ose inovacione të tjera të menaxhimit të të dhënave. Ai përshkruan, për shembull, struktura tabelare dhe kolona relacionale apo klasa dhe atribute të orientuara nga objekti. Një skemë e tillë e të dhënave ndonjëherë referohet si modeli i të dhënave fizike, por në arkitekturën origjinale të tre skemave ANSI, ai quhet "logjik". Në atë dizajn, modeli fizik shpjegon teknologjinë e ruajtjes (cilindrat, gjurmët dhe hapësirat e tavolinës). Në formën ideale, ky model rrjedh nga modeli më ideor i të dhënave të përshkruar më lart. Megjithatë, mund të ndryshojë për të marrë paraqysh limitet si aftësia e përpunimit dhe modelet e shfrytëzimit.

Kurse analiza e të dhënave është një koncept i cili është i zakonshëm për modelimin e të dhënave, veprimtaria në mënyrë konkrente ka më shumë të ngjashme me tezat dhe metodat e sintezës (duke nxjerrë koncepte të përgjithshme nga raste të veçanta) sesa me analizën (identifikimi i koncepteve të elementeve nga ato më të përgjithshme). { Me sa duket ne e quajmë veten analistë të sistemeve sepse askush nuk mund të thotë sintetikë të sistemeve . } Modelimi i të dhënave ka për qëllim të munësojë bashkimin e strukturave të të dhënave me interes në një entitet të qendrueshëm, të pandashëm, duke anuluar tepricat e panevojshme të të dhënave dhe duke lidhur formën e të dhënave me marrëdhëniet.

Një qasje tjetër është shfrytëzimi i sistemeve adaptive si rrjetet nervore artificiale që mund të formojnë në mënyrë autonome struktura të nënkuptuara të të dhënave.

Struktura e të dhënave

Redakto
 
Një pemë binare, një lloj i thjeshtë i strukturës së të dhënave të lidhura me degëzime

Struktura e të dhënave është një teknikë për ruajten e informacionit në një kompjuter në mënyrë që të mund të shfrytëzohen në mënyrë efektshme. Ajo përfaqëson një organizim të koncepteve matematikore dhe logjike të të dhënave. Në shumicën e rasteve një strukturë e të dhënave e zgjedhur me kujdes do të mundësojë përdorimin e algoritmit më efikas . Zgjedhja e strukturës së të dhënave shpesh fillon së pari nga zgjedhja e një lloji abstrakt të të dhënave.

Një model i të dhënave shpjegon strukturën e të dhënave në brendësi të një domeni të përcaktuar dhe, si pasojë, strukturën themelore të vetë atij domeni. Kjo nënkupton që një model i të dhënave në fakt specifikon një gramatikë të dedikuar për një gjuhë artificiale i cili është i orientuar për atë domen. Një model i të dhënave përfaqëson kategoritë e entiteteve (llojet e gjërave) për të cilat një kompani ka dëshirë të ruajë informacion, atributet e atij informacioni dhe marrëdhëniet ndërmjet atyre entiteteve dhe marrëdhëniet (shpesh të nënkuptuar) midis këtyre atributeve. Modeli përshkruan planifikimin e të dhënave në një farë mase, pa marrë parasysh se si mund të ruhen dhe përfaqësohen të dhënat në një sistem kompjuterik.

Njësitë e përfaqësuara nga një model i të dhënave ka mundësi të jenë entitete të prekshme, megjithatë, modelet që përfshijnë kategori të tilla konkrete entiteti kanë prirje të ndryshojnë me kalimin e kohës. Modelet e avancuara të të dhënave shpesh herë identifikojnë abstraksione të entiteteve të tilla..Marrim shembull, një model i të dhënave ka mundësi që të posedojë një klasë entiteti të quajtur "Person", që përfaqëson të gjithë njerëzit që ndërveprojnë me një biznis. Një klasë e tillë entiteti abstrakt është zakonisht më e përshtatshme se ato të quajtura "Shitësi" ose "Punonjës", të cilat identifikojnë role specifike që ata individë mund të luajnë.

Teoria e modelit të të dhënave

Redakto

Termi model i të dhënave, mund të ketë dy kuptime:

  1. Një teori e modelit të të dhënave, dmth. një përshkrim formal se si është e mundur të strukturohen dhe aksesohen të dhënat.
  2. Një shembull i modelit të të dhënave, p.sh. aplikimi i një teorie të modelit të të dhënave për të krijuar një shembull praktik të modelit të të dhënave për ndonjë aplikacion specifik.

Një teori e modelit të të dhënave ka tre elemente kryesore:

  • Pjesa strukturore: një koleksion strukturash të dhënash të cilat përdoren për të formuar baza të të dhënave që përfaqësojnë entitetet ose objektet e modeluara nga baza e të dhënave.
  • Pjesa e integritetit: një koleksion rregullash që rregullojnë kufizimet e vendosura në këto struktura të të dhënave për të ofruar siguri në integritetin strukturor.
  • Pjesa e manipulimit: një koleksion operatorësh që mund të zbatohen në strukturat e të dhënave, për të përditësuar dhe pyetur të dhënat që ndodhen në bazën e të dhënave.

Për shembull, në modelin relacional, porcioni strukturore bazohet në një parim të modifikuar të relacionit matematik ; porcioni i integritetit parqitet në logjikën e rendit të parë dhe porcioni i manipulimit paraqitet duke shfrytëzuar algjebrën relacionale, llogaritjen e dyfishtë dhe llogaritjen e domenit.

Këtu është ilustruar një shembull i cili fokusohet tek pjesa e formimit të modelit të të dhënave formohet duke zbatuar një teori të modelit të të dhënave. Kjo kryesisht bëhet për të zgjidhur disa nevoja të ndërmarrjes së biznesit. Kërkesat e biznesit zakonisht mbulohen nga një model i të dhënave logjike semantike. Kjo ndryshohet në një shembull të modelit të të dhënave në aspektin fizik nga i cili gjenerohet një bazë të dhënash fizike. Për shembull, një modelues i të dhënave ka mundësi të përdorë një pasije modelimi të të dhënave për të formuar një model të marrëdhënies entitet të depove të të dhënave të korporatës të një ndërmarrje biznesi. Ky model është transformuar mëtej në një model relacional, i cili nga këndvështrimi i furnizon një bazë të dhënash relacionale.

Modelet

Redakto

Modelet janë struktura të zakonshme të modelimit të të dhënave që zbatohen në shumë modele të dhënash.

Modele të ngjashme

Redakto

Diagrami i rrjedhës së të dhënave

Redakto
 
Shembull i diagramit të rrjedhës së të dhënave

Një diagram i rrjedhës së të dhënave (DFD) është një paraqitje grafike e "rrjedhës" së të dhënave me anë të një sistemi informacioni . Ai ndryshon nga grafiku i rrjedhës pasi tregon rrjedhën e të dhënave në vend të rrjedhës së kontrollit të programit. Një diagram i rrjedhës së të dhënave mund të përdoret poashtu për vizualizimin e përpunimit të të dhënave (dizajni i strukturuar). Diagramet e rrjedhës së të dhënave u zbuluan nga Larry Constantine, zhvilluesi origjinal i dizajnit të strukturuar, duke u bazuar në modelin e llogaritjes "grafiku i rrjedhës së të dhënave" të Martin dhe Estrin.

Është aktivitet i zakonshëm që fillimisht të konstruktohet një diagram i rrjedhës së të dhënave në nivel konteksti, i cili paraqet ndërveprimin ndërmjet sistemit dhe entiteteve të jashtme. DFD është dizajnuar në mënyrë që të tregojë se si një sistem ndahet në porcione më të vogla dhe për të theksuar rrjedhën e të dhënave midis atyre porcioneve përkstësr. Ky diagram i rrjedhës së të dhënave në shkallë të kontekstit më pas "shpërthehet" për të treguar më shumë karakteristika të sistemit që modelohet.

Modeli i informacionit

Redakto
 
Shembull i një modeli informacioni EXPRESS G

Një model informacioni nuk paraqet një kategori modeli të dhënash, por përafërsisht një model opsional. Brenda sferës së inxhinierisë softuerike, si një model i të dhënave ngjashëm edhe një model informacioni mund të jenë abstrakte, përfaqësime formale të tipeve të njësive që përfshijnë vetitë, marrëdhëniet dhe operacionet e tyre që mund të punohen mbi to. Llojet e njësive ekonomike në model mund të jenë lloje të objekteve të botës reale, të tilla si mjete në një rrjet, ose ato vetë mund të jenë të përgjithësuara, si për entitetet e përdorura në një sistem faturimi.Përdorimi i tyre gjen zbatim te modelimi një domeni të kufizuar i cili mund të përshkruhet nga një grup i mbyllur i llojeve, vetive, marrëdhënieve dhe operacioneve të ndryshme për sa i përket entiteteve.

Sipas Lee (1999)[9] [9] [9] një model informacioni është një paraqitje e koncepteve, marrëdhënieve, kufizimeve, rregullave dhe operacioneve për të specifikuar semantikën e të dhënave për një fushë të zgjedhur të ligjërimit. Mund të ofrojë siguri nj strukturë të përbashkët, të qëndrueshme dhe të organizuar të kërkesave të informacionit për kontekstin e domenit. Në përgjithësi termi model informacioni përdoret për modele të gjërave individuale, si objekte, ndërtesa, impiante procesi, etj. Në këto raste koncepti është i specializuar në Modelin e Informacionit të Objektit, Modelin e Informacionit të Ndërtesës, Modelin e Informacionit të Impiantit, etj. modeli i informacionit është një kombinim i një modeli të objektit me të dhënat dhe dokumentet rreth objektit.

Standarizimi për përshkrimin e një problemi të domenës pa kufizuar ofrohet nga një model informacioni përkatësisht mënyrën se si ai përshkrim është i lidhur me një aplikim të tanishëm në pjesën softuerike. Mund të ketë shumë harta të modelit të informacionit. Hartografi të tilla quhen modele të dhënash, pavarësisht faktit që ato janë modele objektesh (p.sh. duke përdorur UML ), modele entitet-marrëdhënie ose skema XML.

 
Modeli i objektit të dokumentit, një model standard objekti për përfaqësimin e HTML ose XML

Modeli i objektit

Redakto

Një model objekti në shkencën kompjuterike është një grupim objektesh ose klasash përmes të cilave një aplikacion mund të ekzaminojë dhe manipulojë disa pjesë specifike të botës së tij. Me fjalë të tjera, ndërfaqja e orientuar nga objekti për një shërbim ose sistem. Një ndërfaqe e tillë shprehet se është modeli i objektit të shërbimit ose sistemit të përfaqësuar. Për shembull, modeli i objektit të dokumentit (DOM) [1] është një koleksion objektesh që përfaqësojnë një faqe në një shfletues ueb, të përdorur nga programet e skriptit për të ekzaminuar dhe transformuar në mënyrë dinamike faqen. Ekziston një model objekti i Microsoft Excel për kontrollin e Microsoft Excel nga një program tjetër, dhe drejtuesi i teleskopit ASCOM [10] është një model objekti për kontrollin e një teleskopi astronomik.

Në llogaritje, termi model i objektit ka një kuptim të dytë të veçanta të karakteristikave të përgjithshme të objekteve në një gjuhë programimi kompjuterik, teknologji, shënim ose metodologji specifike që i shfrytëzon ato. Për shembull, modeli i objektit Java, modeli i objektit COM ose modeli i objektit OMT . Modele të tilla objektesh kryesisht caktohen duke shfrytëzuar ide të tilla si klasa, mesazhi, trashëgimia, polimorfizmi dhe kapsulimi . Ekziston një literaturë e pasur mbi modelet e objekteve të standardizuara si një nëngrup i semantikës formale të gjuhëve të programimit.

Modelimi i rolit të objektit

Redakto
 
Shembull i aplikimit të Modelimit Objekt-Role në një "Skemë për Sipërfaqen Gjeologjike", Stephen M. Richard (1999)

Modelimi i Objekt-Rolit (ORM) është një teknikë për modelimin konceptual, dhe mund të përdoret si një paisje për analizën e informacionit dhe rregullave.

Modelimi objekt-roli është një metodë e bazuar nga faktet për realizimin e analizave të sistemeve në shkallën konceptuale. Cilësia e një aplikacioni bazë të dhënash kushtëzohet në mënyrë kritike nga dizajni i tij. Për të ndihmuar në sigurimin e korrektësisë, qartësisë, përshtatshmërisë dhe produktivitetit, sistemet e informacionit specifikohen më së miri fillimisht në nivelin konceptual, duke përdorur terme dhe gjuhë që janë të lehta për përdoruesit të kuptojnë.

Dizajni konceptual mund të përmbajë të dhëna, procese dhe perspektiva të sjelljes, dhe DBMS-ja aktuale e përdorur për aplikimin e dizajnit mund të bazohet në njërën nga modelet e shumta logjike të të dhënave (relacionale, hierarkike, rrjetore, të orientuara nga objekti, etj.).

Modele të Unifikuara të Gjuhës së Modelimit

Redakto

Gjuha e Unifikuar e Modelimit (UML) është një gjuhë modelimi e standardizuar për synime të përgjithshme në sferën e inxhinierisë softuerike . Është një gjuhë grafike që shërben për vizualizimin, specifikimin, konstruktimin dhe dokumentimin e objekteve të një sistemi me softuer intensiv. Gjuha e Unifikuar e Modelimit ofron një mënyrë të standarde për të shënuar planet e një sistemi, duke përfshirë:

  • Gjëra konceptuale si proceset e biznesit dhe funksionet e sistemit
  • Konkretoni gjëra të tilla si deklaratat e gjuhëve të programimit, strukturat e bazës së të dhënave dhe
  • Komponentët e softuerit që mund të ripërdoren përsëri.

UML ofron një kombinim të modeleve funksionale, modeleve të të dhënave dhe modeleve të bazës së të dhënave.

Shihni gjithashtu

Redakto

Referime

Redakto
  1. ^ "What is a Data Model?". princeton.edu (në anglisht). Marrë më 29 maj 2024.
  2. ^ "UML Domain Modeling – Stack Overflow". Stack Overflow (në anglisht). Stack Exchange Inc. Marrë më 4 shkurt 2017.
  3. ^ Michael R. McCaleb (1999). "A Conceptual Data Model of Datum Systems" Arkivuar 2008-09-21 tek Wayback Machine. National Institute of Standards and Technology. August 1999.
  4. ^ a b c Matthew West and Julian Fowler (1999). Developing High Quality Data Models Arkivuar 9 shtator 2020 tek Wayback Machine. The European Process Industries STEP Technical Liaison Executive (EPISTLE).
  5. ^ Janis A. Bubenko jr (2007) "From Information Algebra to Enterprise Modelling and Ontologies - a Historical Perspective on Modelling for Information Systems". In: Conceptual Modelling in Information Systems Engineering. John Krogstie et al. eds. pp 1-18
  6. ^ Data and Reality (në anglisht)
  7. ^ a b c d FIPS Publication 184 Arkivuar 2013-12-03 tek Wayback Machine released of IDEF1X by the Computer Systems Laboratory of the National Institute of Standards and Technology (NIST). 21 December 1993 (withdrawn in 2008).
  8. ^ a b c David R. Soller1 and Thomas M. Berg (2003). The National Geologic Map Database Project: Overview and Progress U.S. Geological Survey Open-File Report 03–471.
  9. ^ a b c Y. Tina Lee (1999). "Information modeling from design to implementation" National Institute of Standards and Technology.
  10. ^ "ASCOM General Requirements" (në anglisht). 2011-05-13. Marrë më 2014-09-25.

Lexim të mëtejshëm

Redakto
  • David C. Hay (1996). Modelet e modelit të të dhënave: Konventat e mendimit . Nju Jork: Dorset House Publishers, Inc.
  • Len Silverston (2001). The Data Model Resource Book Volume 1/2. John Wiley & Sons.
  • Len Silverston & Paul Agnew (2008). Libri i burimeve të modelit të të dhënave: Modele universale për modelimin e të dhënave Vëllimi 3. John Wiley & Sons.
  • Matthew West (2011) Zhvillimi i Modeleve të të Dhënave me Cilësi të Lartë Morgan Kaufmann