Den relationella datamodellen är Definition, koncept, struktur och teori för normalisering

Innehållsförteckning:

Den relationella datamodellen är Definition, koncept, struktur och teori för normalisering
Den relationella datamodellen är Definition, koncept, struktur och teori för normalisering
Anonim

Den relationella datamodellen är ett unikt tillvägagångssätt för att hantera parametrar med hjälp av struktur och språk enligt logik för predikat av en enda ordning. Den beskrevs första gången 1969 av den engelske vetenskapsmannen Codd. I detta projekt presenteras alla parametrar som tuplar grupperade i vissa relationer.

Syftet med relationsdatamodellen…

relationsdatarepresentationsmodell
relationsdatarepresentationsmodell

…är att tillhandahålla en deklarativ metod för att specificera modeller och frågor.

Användare noterar direkt vilken information databasen innehåller och vilken teori de vill ha från den. Och låt även databashanteringsprogramvaran ta hand om att beskriva strukturerna för att lagra den. Informationshämtningsproceduren för att svara på förfrågningar är också viktig.

De flesta RDB:er använder SQL-datadefinitioner och ett sökspråk. Dessa system implementerar vad som kan ses som en teknisk approximation tillrelationsmodell.

En tabell i ett SQL-databasschema motsvarar en predikatvariabel. Nyckelbegränsningar och SQL-frågor matchar predikat.

Sådana databaser avviker dock från relationsmodellen i många detaljer, och Codd har häftigt motsatt sig förändringar som äventyrar de ursprungliga principerna.

Översikt

typer av datamodeller relationsdatamodell
typer av datamodeller relationsdatamodell

Huvudidén med relationsdatamodellen är beskrivningen av hela databasen som en uppsättning predikat för den slutliga komponenten av variablerna, som beskriver begränsningarna för möjliga värden och deras kombinationer. Innehållet vid varje given tidpunkt är den slutliga (logiska) modellen. Det vill säga en uppsättning relationer, en per predikatvariabel, så att alla komponenter är uppfyllda. Detta är den relationella datamodellen.

Alternativ

relationsdatamodellstruktur
relationsdatamodellstruktur

Andra modeller är hierarkiska system och nätverkssystem. Vissa av dem, som använder äldre arkitekturer, är fortfarande populära i datacenter med hög kapacitet. Eller i fall där befintliga system är så komplexa och abstrakta att övergången till dem med hjälp av relationsmodellen skulle bli oöverkomligt dyr. Och också att notera är de nya objektorienterade databaserna.

Implementation

relationsdatamodellbegrepp
relationsdatamodellbegrepp

Det har gjorts flera försök att få den verkliga materialiseringen av RMD, som ursprungligen definierades av Codd och förklarades av andraforskare.

Den relationella datarepresentationsmodellen var den främsta i sitt slag, som beskrevs i formella matematiska termer. Hierarkiska baser och nätverksbaser fanns före relationssystem, men deras specifikationer var relativt informella. När RMD väl hade definierats gjordes många försök att jämföra och kontrastera olika modeller – och detta ledde till mer rigorösa beskrivningar av tidiga system. Även om den processuella karaktären hos datamanipuleringsgränssnitten för hierarkiska databaser och nätverksdatabaser begränsade möjligheterna till formalisering.

Themes

Det grundläggande antagandet om konceptet med en relationsdatamodell är att de alla representeras som ett matematiskt "p" - typiska relationer, "Cn" - ett parvis samband, som är en delmängd i den kartesiska produkten av flera domäner. I den matematiska modellen förs resonemang om sådana data i en tvåvärdig predikatlogik, vilket innebär att det för varje mening finns två möjliga utvärderingar: antingen sant eller falskt (och det finns inget tredje värde, till exempel okänt eller inte tillämpligt, som var och en ofta förknippas med begreppet 0). Data bearbetas med hjälp av kalkyl eller algebra, som är ekvivalenta i uttryckskraft.

Typer av datamodeller, relationsdatamodell

RMD tillåter utvecklaren att skapa en konsekvent, logisk bild av information. Allt detta uppnås genom att införliva de angivna begränsningarna i databasdesignen, vanligen kallad det logiska schemat. Teorin är att utveckla en processmodellnormalisering, varvid en design med vissa önskade egenskaper kan väljas från en uppsättning logiskt ekvivalenta alternativ. I åtkomstplaner och andra implementeringar och operationer hanteras detaljerna av DBMS-motorn och återspeglas inte i den logiska modellen. Detta i motsats till vanlig praxis där prestandajustering ofta kräver ändringar av logikfunktionen.

Den grundläggande relationsdatamodellen representerar en byggsten – det är en domän eller typ av information, vanligtvis reducerad till ett minimum. En tupel är en ordnad uppsättning attributvärden. Och de är i sin tur ett ömsesidigt par av namn och typ. Det kan antingen vara ett skalärt värde eller ett mer komplext.

En relation består av en rubrik och en body

grunderna i relationsdatamodellen
grunderna i relationsdatamodellen

Den första är en uppsättning attribut.

Kroppen (med den n:te relationen) är en uppsättning tupler.

Tangency-rubriken är också föremål för varje struktur.

Relationsdatamodellen definieras som en uppsättning n-tupler. I både matematik och MRD är en uppsättning en oordnad samling av unika icke-duplicerade element, även om vissa DBMS:er påtvingar sina data en sekvens. I matematik har en tupel en ordning och tillåter dubbelarbete. E. F. Codd satte ursprungligen upp tuplar med denna matematiska definition.

Senare var en av E. F. Codds fantastiska idéer att det skulle vara mycket bekvämare att använda attributnamn istället för att beställa (i allmänhetcase) på ett relationsbaserat datorspråk. Detta uttalande är användbart än idag. Även om konceptet har förändrats har namnet "tupel" inte förändrats. En omedelbar och viktig konsekvens av denna distinktion är att i relationsmodellen blir den kartesiska produkten kommutativ.

En tabell är en vanlig visuell representation av relationer. En tuppel liknar begreppet en sträng.

Relvar är en namngiven variabel av någon speciell typ av tangent som alltid är tilldelad någon relation av den typen, även om blicken kan innehålla nolltupler.

Grunderna i relationsdatamodellen: all information representeras av informationsvärden i relationer. I enlighet med denna princip är relationsbasen en uppsättning relvar, och resultatet av varje fråga representeras som en tangency.

Konsistensen hos en relationsdatabas upprätthålls inte av regler som är inbyggda i applikationerna som använder den, utan snarare av begränsningar som deklareras som en del av det logiska schemat och upprätthålls av DBMS för alla applikationer. Restriktioner uttrycks i användningen av relationella jämförelseoperatorer, av vilka endast en är en delmängd (⊆), teoretiskt tillräckligt. I praktiken förväntas flera användbara genvägar finnas tillgängliga, av vilka kandidatnycklar och externa källbegränsningar är de viktigaste. Detta är vad relationsdatamodellen handlar om.

Tolkning

För att fullt ut kunna uppskatta RMD är det nödvändigt att förstå den avsedda tolkningensom en relation.

Kroppen i en beröring kallas ibland dess förlängning. Detta eftersom det ska tolkas som att det representerar en ökning av något predikat. Detta är uppsättningen sanna meningar som kan bildas genom att ersätta varje fri variabel med ett namn.

Det finns en en-till-en-överensstämmelse mellan objektrelationella datamodeller. Varje tupel i relationskroppen tillhandahåller attributvärden för att instansiera predikatet genom att ersätta var och en av dess fria variabler. Resultatet är ett påstående som anses sant på grund av förekomsten av en tupel i kroppen av relationen. Omvänt anses varje process vars titel matchar förhållandets namn men inte visas i brödtexten vara falsk.

Detta antagande är känt som hypotesen om sluten värld. Det bryts ofta i praktiska databaser, där frånvaron av en tupel kan innebära att sanningen i motsvarande mening är okänd. Till exempel kan frånvaron av vissa termer ("John", "spanska") i språkkunskapstabellen inte nödvändigtvis vara ett bevis på att en pojke som heter John inte talar spanska.

Applikation till databaser, normaliseringsteori

Informationsämnet som används i en typisk relationell RDM kan vara en uppsättning heltal, en uppsättning teckensträngar som utgör datum, eller två booleans sant och falskt, och så vidare. Motsvarande ämnesnamn för dessa figurer kan vara strängar med namnen "Index", "Gör det nödvändiga arbetet","Time", "Boolean" och så vidare och så vidare.

Det är dock viktigt att förstå att relationsteori inte anger vilka typer som ska stödjas. Och det är verkligen sant, det förväntas för närvarande att bestämmelser kommer att vara tillgängliga för anpassade enheter utöver de inbyggda som tillhandahålls av systemet.

Attribute

den relationella datamodellen representerar
den relationella datamodellen representerar

Det här är termen som används i teorin för vad som brukar kallas en kolumn. På liknande sätt används tabell vanligtvis i stället för den teoretiska termen tangency (även om det inte på något sätt är synonymt med relation i SQL). Datastrukturen för en tabell anges som en lista med kolumndefinitioner, var och en med ett unikt kolumnnamn och den typ av värden som är tillåtna för den.

Attributvärde är en post på en specifik plats, till exempel John Doe och 35.

En tuppel är i princip detsamma som en rad, förutom att i SQL RDBMS, där betydelsen av kolumnerna i en rad är ordnade, är tuplarna inte separerade. Istället identifieras varje definitionsvärde enbart av dess namn, inte av dess ordinarie position i tupeln. Attributnamnet kan vara Namn eller Ålder.

Attitude

den relationella datamodellen är
den relationella datamodellen är

Det är en strukturdefinitionstabell tillsammans med förekomsten av data i den strukturen. Definitionen är rubriken och data i den är kroppen, en uppsättning rader. Relationsvariabeln brukar kallas huvudtabellen. Titeln på värdet som tilldelats den inär som helst matchar den som anges i den givna cellen, och dess kropp matchar den som den senast tilldelades, vilket anropar någon uppdateringssats (vanligtvis INSERT, UPDATE eller DELETE).

Mängdteoretisk formulering

Grundbegrepp i relationsmodellen för relationer är namn och namn på attribut. De måste representeras som strängar som "Person" och "Namn" och kommer vanligtvis att behöva använda variabler för att spänna över dem. Ett annat grundläggande koncept är en uppsättning atomvärden som innehåller nödvändiga och viktiga betydelser som siffror och strängar.

Rekommenderad: