當前位置:吉日网官网 - 傳統節日 - 數據庫名詞解釋?

數據庫名詞解釋?

數據庫的概念:

數據庫是按照數據結構組織、存儲和管理數據的倉庫。它產生於60多年前。隨著信息技術和市場的發展,特別是90年代以後,

數據管理不再僅僅是存儲和管理數據,而是轉變為用戶需要的各種數據管理方式。數據庫的類型很多,從最簡單的有各種數據的表格,到可以存儲海量數據的大型數據庫系統,在各個方面都得到了廣泛的應用。

在信息社會中,充分有效地管理和利用各種信息資源是科學研究和決策管理的前提。數據庫技術是管理信息系統、辦公自動化系統、決策支持系統等各種信息系統的核心部分,是科學研究和決策管理的重要技術手段。

數據庫的定義:

定義1:數據庫是建立在計算機存儲設備上,按照數據結構組織、存儲和管理數據的倉庫。

簡單來說,可以看作是電子文件櫃——存放電子文件的地方。用戶可以添加、截取、更新和刪除文檔中的數據。

在經濟管理的日常工作中,往往需要將壹些相關數據放入這樣的“倉庫”,根據管理的需要進行處理。

比如企事業單位的人事部門,往往存儲著員工的基本信息(工號、姓名、年齡、性別、籍貫、工資、簡歷等。)放在壹個表中,可以看作是壹個數據庫。有了這個“數據倉庫”,我們可以根據需要隨時查詢壹個員工的基本情況,還可以查詢工資在壹定範圍內的員工人數等等。如果這些工作都可以在計算機上自動進行,那麽我們的人事管理就可以達到壹個很高的水平。此外,在財務管理、倉庫管理和生產管理中,也需要建立許多這樣的“數據庫”,實現財務、倉庫和生產的計算機自動化管理。

定義2:

嚴格地說,數據庫是長期存儲在計算機中的有組織的、可訪問的數據集合。數據庫中的數據以壹定的數據模型進行組織、描述和存儲,具有冗余度最小、數據獨立性高、易於擴展的特點,可以在壹定範圍內被多個用戶共享。

這類數據集有以下特點:盡可能不重復,以最優的方式服務於特定組織的多種應用。其數據結構獨立於使用它的應用程序,數據的添加、刪除、修改和檢索由統壹的軟件管理和控制。從發展歷史來看,數據庫是數據管理的高級階段,是由文件管理系統發展起來的。[1][2]

數據庫處理系統:

數據庫是壹個單位或壹個應用領域的通用數據處理系統,它存儲著屬於企業、機構、團體和個人的相關數據的集合。數據庫中的數據是從全局的角度建立的,並按照壹定的數據模型進行組織、描述和存儲。它的結構基於數據之間的自然關系,因此可以提供所有必要的訪問路徑,數據不再針對某個應用,而是針對整個組織,具有整體的結構特征。

數據庫中的數據是為許多用戶享受他們的信息而建立的,並且已經擺脫了特定程序的限制和約束。不同的用戶可以根據自己的用途使用數據庫中的數據;多個用戶可以同時享用數據庫中的數據資源,即不同的用戶可以同時訪問數據庫中的相同數據。數據的享受既滿足了用戶對信息內容的要求,也滿足了用戶之間信息交流的要求。

數據庫的基本結構:

數據庫的基本結構分為三個層次,反映了觀察數據庫的三種不同視角。

由內部模式組成的數據庫稱為物理數據庫;由概念模式組成的數據稱為概念數據庫。由外部模式組成的數據庫稱為用戶數據庫。

(1)物理數據層。

它是數據庫的最內層,是實際存儲在物理存儲設備上的數據集合。這些數據是原始數據,由用戶處理,由內部模式描述的指令操作處理的位串、字符和字組成。

⑵概念數據層。

它是數據庫的中間層,是數據庫的整體邏輯表示。指出每個數據的邏輯定義和數據之間的邏輯關系是存儲記錄的集合。它涉及數據庫中所有對象的邏輯關系,而不是它們的物理條件,是數據庫管理員概念下的數據庫。

(3)用戶數據層。

它是用戶看到和使用的數據庫,代表壹個或壹些特定用戶使用的數據集,即邏輯記錄集。

不同級別的數據庫之間的關系通過映射進行轉換。

該數據庫的主要特點:

(1)實現數據* * *

數據共享包括所有用戶可以同時訪問數據庫中的數據,用戶可以通過接口以各種方式使用數據庫並提供數據共享。

⑵減少數據冗余。

與文件系統相比,由於數據庫實現了數據共享,避免了用戶單獨創建應用文件。減少大量重復數據,降低數據冗余,保持數據壹致性。

(3)數據獨立性

數據的獨立性包括邏輯獨立性(數據庫和應用程序的邏輯結構相互獨立)和物理獨立性(數據物理結構的變化不影響數據的邏輯結構)。

(4)數據集中控制。

在文件管理模式下,數據處於去中心化狀態,不同的用戶或者同壹個用戶在不同的進程中對自己的文件無所作為。數據庫可以用來集中控制和管理數據,數據模型可以用來表達各種數據的組織和數據之間的關系。

⑸數據的壹致性和可維護性,確保數據的安全性和可靠性。

主要包括:①安全控制:防止數據丟失、錯誤更新和未授權使用;②完整性控制:保證數據的正確性、有效性和兼容性;③並發控制:在同壹時間段內,允許對數據的多次訪問,可以防止用戶之間的異常交互。

[6]故障恢復

數據庫管理系統提供的壹套方法可以及時發現並修復故障,從而防止數據被破壞。數據庫系統可以盡快恢復數據庫系統運行期間發生的故障,這些故障可能是物理或邏輯錯誤。比如系統誤操作導致的數據錯誤。

數據庫的數據類型:

數據庫通常分為三種類型:層次數據庫、網絡數據庫和關系數據庫。不同的數據庫按照不同的數據結構連接和組織。

1.數據結構模型

(1)數據結構

所謂數據結構,是指數據的組織形式或者數據之間的聯系。

如果D表示數據,R表示數據對象之間的關系集,則DS=(D,R)稱為數據結構。

比如有壹個電話簿,裏面記錄了n個人的名字和對應的電話號碼。為了方便查找某人的電話號碼,姓名和號碼按字典順序排列,對應的電話號碼後接姓名。這樣,如果妳想找壹個人的電話號碼(假設他名字的第壹個字母是Y),妳只需要找到那些以Y開頭的名字就可以了,在這個例子中,數據集D是名字和電話號碼,它們之間的關系R是按照字典順序排列的,它對應的數據結構是DS=(D,R),也就是壹個數組。

⑵數據結構類型

數據結構分為數據的邏輯結構和物理結構。

數據的邏輯結構是從邏輯的角度(即數據的聯系和組織)來觀察和分析數據,而不考慮數據的存儲位置;數據的物理結構是指存儲在計算機中的數據的結構,即數據的邏輯結構在計算機中的實現形式,所以物理結構也叫存儲結構。

這裏只研究數據的邏輯結構,反映和實現數據連接的方法稱為數據模型。

目前流行的數據模型有三種,分別是根據圖論建立的層次結構模型和網絡結構模型以及根據關系理論建立的關系結構模型。

2.分層、網狀和關系數據庫系統

(1)層次結構模型

層次結構模型本質上是壹棵有根節點的有向有序樹(數學上把“樹”定義為無環連通圖)。下圖是壹所高等院校的組織架構。這個組織結構圖就像壹棵樹。學校系是根(稱為根節點),系、專業、老師、學生是分支(稱為節點),根與分支的連接稱為邊,根與邊的比值為1:N,即只有壹個根,N個分支。

按照層次模型建立的數據庫系統稱為層次模型數據庫系統。IMS(信息管理系統)就是其典型代表。

⑵網絡結構模型

按照網格數據結構建立的數據庫系統稱為網格數據庫系統,其典型代表是DBTG(DatabaseTaskGroup)。網格數據結構可以通過數學方法轉換成分層數據結構。

⑶關系結構模型

關系數據結構將壹些復雜的數據結構簡化為簡單的二元關系(即二維表格形式)。比如某單位的員工關系就是二元關系。

由關系數據結構組成的數據庫系統稱為關系數據庫系統。

在關系數據庫中,幾乎所有對數據的操作都是基於壹個或多個關系表,通過對這些關系表進行分類、合並、連接或選擇來實現數據管理。

DBASE是這類數據庫管理系統的典型代表。對於壹個實際應用問題(比如人事管理),有時需要多種關系才能實現。用dBASE建立的壹個關系稱為數據庫(或數據庫文件),對應多個關系建立的多個數據庫稱為數據庫系統。dBASE的另壹個重要功能是通過創建命令文件來使用和管理數據庫。數據庫系統對應的命令序列文件稱為數據庫的應用系統。

所以簡單來說,壹個關系叫做壹個數據庫,幾個數據庫可以組成壹個數據庫系統。數據庫系統可以派生出各種類型的輔助文件,建立其應用系統。

數據庫發展簡史;

1數據庫的技術開發

使用計算機後,隨著數據處理能力的增加,數據管理技術應運而生。數據管理技術的發展與計算機硬件(主要是外存)、系統軟件和計算機應用範圍密切相關。數據管理技術的發展經歷了四個階段:手工管理階段、文件系統階段、數據庫階段和高級數據庫技術階段。

2數據管理的誕生

數據庫的歷史可以追溯到五十年前,那時數據管理非常簡單。通過大量的機器進行分類、比較和制表,運行數百萬張穿孔卡處理數據,並將運行結果打印在紙上或制成新的穿孔卡。數據管理是所有這些穿孔卡片的物理存儲和處理。然而,在1950年,來自RemingtonRandInc的壹臺名為UnivacI的計算機推出了壹種可以在壹秒鐘內輸入數百條記錄的磁帶機,引發了壹場數據管理的革命。1956年,IBM生產了第壹臺磁盤驅動器——型號為305 ramac。這個驅動器有50個磁盤,每個磁盤的直徑為2英尺,可以存儲5MB的數據。使用磁盤最大的優點是可以隨機存取數據,而穿孔卡和磁帶只能順序存取數據。

1951: Univac系統使用磁帶和穿孔卡片作為數據存儲。

數據庫系統的萌芽出現在20世紀60年代。當時計算機開始廣泛應用於數據管理,對數據享受提出了越來越高的要求。傳統的文件系統已經不能滿足人們的需求,能夠統壹管理和共享數據的數據庫管理系統(DBMS)應運而生。數據模型是數據庫系統的核心和基礎,各種DBMS軟件都基於某種數據模型。因此,根據數據模型的特點,傳統的數據庫系統通常分為三類:網狀數據庫、層次數據庫和關系數據庫。

最早的mesh DBMS是美國通用電氣公司的Bachman等人在1961年開發的IDS(IntegratedDataStore)。1964年,美國通用電氣公司的CharlesBachman成功開發了世界上第壹個mesh DBMS,即第壹個數據庫管理系統——IntegratedDataStoreIDS,為mesh數據庫奠定了基礎,並在當時得到了廣泛的分布和應用。IDS具有數據模式和日誌的特性,但只能在GE主機上運行,數據庫只有壹個文件,數據庫中的所有表格都必須手工編碼生成。後來,通用電氣公司的壹個客戶BF古德裏奇化學公司最終不得不重寫整個系統,並將重寫後的系統命名為綜合數據管理系統(IDMS)。

網狀數據庫模型可以自然地模擬分層和非分層的事物。在關系數據庫出現之前,網狀DBMS比層次DBMS應用更廣泛。在數據庫發展史上,網狀數據庫占有重要的地位。

分層DBMS出現在網絡數據庫之後。最著名最典型的層次數據庫系統是IBM在1968年開發的IMS(信息管理系統),這是壹個適合其主機的層次數據庫。這是IBM開發的最早的大型數據庫系統程序產品。它產生於60年代末,現在已經發展到IMSV6,提供了對集群、N路數據共享、消息隊列共享等高級特性的支持。這個有30年歷史的數據庫產品在今天的WWW應用連接和商業智能應用中扮演著新的角色。

1973年,Cullinane公司(後來的Cullinet軟件公司)開始銷售古德裏奇公司的IDMS改進版,逐漸成為當時世界上最大的軟件公司。

數據庫關系的來源:

網狀數據庫和層次數據庫很好地解決了數據集中和共享的問題,但仍然很缺乏數據獨立性和抽象性。用戶在訪問這兩個數據庫時,仍然需要明確數據的存儲結構,指出訪問路徑。後來出現的關系數據庫很好地解決了這些問題。

1970年,IBM研究員E.F.Codd博士在《CommunicationoftheACM》雜誌上發表了題為《面向大型共享數據庫的數據關系模型》的論文,提出了關系模型的概念,奠定了關系模型的理論基礎。盡管Childs在1968中提出了面向集合的模型,但這篇論文被普遍認為是數據庫系統史上劃時代的裏程碑。Codd的願望是為數據庫建立壹個漂亮的數據模型。後來Codd陸續發表了很多文章,討論度量關系系統的範式理論和12標準,用數學理論奠定了關系數據庫的基礎。關系模型具有嚴格的數學基礎,高度的抽象性,簡單明了,易於理解和使用。但當時有人認為關系模型是壹種理想化的數據模型,用它來實現DBMS是不現實的,尤其擔心關系數據庫的性能難以接受,甚至有人將其視為對正在進行的mesh數據庫標準化的嚴重威脅。為了促進對問題的理解,1974 ACM牽頭組織了壹次研討會,會上進行了壹場支持和反對關系數據庫兩派的辯論,分別由Codd和Bachman牽頭。這場著名的爭論促進了關系數據庫的發展,並最終使其成為現代數據庫產品的主流。

1969 Edgar F. "ted" codd發明了關系數據庫。

1970的關系模型建立後,IBM在聖何塞實驗室增加了更多的研究人員來研究這個項目,也就是著名的SystemR。它的目標是證明壹個全功能關系數據庫管理系統的可行性。項目結束於1979,完成了第壹個實現SQL的DBMS。但是IBM對IMS的承諾阻止了SystemR的投產,直到1980 SystemR才作為產品正式投入市場。IBM產品化步伐緩慢的原因有三:IBM重視信譽,重視質量,盡量減少失敗;IBM是壹家擁有龐大官僚體系的大公司。IBM已經有了層次化的數據庫產品,相關人員並不積極甚至反對。

然而與此同時,在1973年,加州大學伯克利分校的MichaelStonebraker和EugeneWong利用SystemR公布的資料,開始開發自己的關系數據庫系統Ingres。他們開發的Ingres項目最終被矽谷的Oracle、Ingres等廠商商業化。後來SystemR和Ingres都獲得了ACM的1988“軟件系統獎”。

從65438到0976,Honeywell開發了第壹個商用關系數據庫系統——multicsrelationaldatastore。關系數據庫系統是以關系代數為基礎的。經過幾十年的發展和實際應用,該技術日趨成熟和完善。其代表產品有Oracle、IBM的DB2、微軟的MSSQLServer、Informix、ADABASD等。

數據庫的開發階段:

數據庫的發展階段大致可以分為以下幾個階段:手工管理階段、文件系統階段、數據庫系統階段、高級數據庫階段。

人工管理階段

在50年代中期之前,計算機的軟件和硬件都不完善。硬件存儲設備只有磁帶、卡片和紙帶,軟件上沒有操作系統。那時,計算機主要用於科學計算。在這個階段,由於沒有管理數據的軟件系統,程序員不僅要指定數據的邏輯結構,還要設計其物理結構,包括存儲結構、存取方法、輸入輸出方法等。當數據的物理組織或存儲設備改變時,用戶程序必須重新編程。由於數據組織是面向應用的,不同的計算程序無法共享數據,因此不同應用之間存在大量重復數據,很難保持應用之間數據的壹致性。

這壹階段的主要特征可以總結如下:

(1)電腦中沒有支持數據管理的軟件,電腦系統不提供管理用戶數據的功能。應用程序只包含它需要的所有數據。用戶在編寫程序時,必須充分考慮相關數據,包括數據定義、存儲結構和即時訪問方法。程序和數據是壹個不可分割的整體。沒有程序,數據沒有價值,數據沒有獨立性。

(2)數據不能* * *享受。不同的程序都有自己的數據,通常不同的程序有不同的數據,無法共享;即使不同的程序使用同壹組數據,這些數據也不能共享。程序還是需要單獨添加這組數據,任何部分都不能省略。基於這種數據無法享受,必然會導致程序間大量重復數據,浪費存儲空間。

(3)數據不能單獨保存。數據的邏輯結構和物理結構要在程序中指定,數據和程序不是獨立的。基於數據和程序是壹個整體,數據只被這個程序使用,數據只有和相應的程序壹起保存才有價值,否則毫無用處。因此,所有程序的數據都不會單獨保存。數據處理的方式是批處理。

文件系統階段:

這個階段的主要標誌是計算機有了管理數據庫的軟件——操作系統(文件管理)。

50年代中期到60年代中期,由於硬盤、磁鼓等大容量直接存儲設備的出現,

它促進了軟件技術的發展,軟件領域出現了操作系統和高級軟件。操作系統中的文件系統是管理外部存儲的數據管理軟件,操作系統為用戶使用文件提供了友好的界面。操作系統的出現標誌著數據管理進入了壹個新的階段。在文件系統階段,數據以文件為單位存儲在外部存儲器中,由操作系統管理。文件是操作系統管理的重要資源。

文件系統階段的數據管理具有以下特點:

優勢

(1)數據可以以“文件”的形式長期存儲在外存的磁盤上。隨著計算機應用轉向信息管理,需要大量的操作,如查詢、修改和插入文件。

(2)數據的邏輯結構不同於物理結構,程序與數據分離,使得數據和程序具有壹定的獨立性,但相對簡單。數據的邏輯結構是指呈現給用戶的數據結構的形式。數據的物理結構是指數據在計算機存儲設備上的實際存儲結構。度和數據之間存在“設備無關性”,即程序只使用文件名就可以處理數據,而不考慮數據的物理位置。訪問方法(讀/寫)由操作系統的文件系統提供。

(3)文獻組織多樣化。有索引文件、鏈接文件和直接訪問文件。但是文檔之間相互獨立,缺乏聯系。數據之間的關系需要通過程序來構建。

(4)數據不再屬於某個特定的程序,可以重用,即數據是面向應用的。但是文件結構的設計還是基於特定的用途,程序是基於特定的物理結構和訪問方式,所以度和數據結構之間的依賴關系並沒有發生根本的改變。

(5)用戶的程序和數據可以分別存儲在外部存儲器中,每個應用程序可以* * *享用壹組數據,從而實現以文件為單位* * *共享數據的文件系統。

(6)數據的操作是以記錄為基礎的。這是因為文件只存儲數據,不存儲文件記錄的結構描述信息。文件的建立、存取、查詢、插入、刪除和修改都必須通過程序來實現。

(7)數據處理方式包括批處理和在線實時處理。

劣勢

雖然文件系統在提高計算機數據管理能力方面發揮了很大的作用,但隨著數據管理規模的擴大,數據量急劇增加,文件價格體系也顯現出壹些缺陷。這些問題如下:

(1)數據文件是為了滿足某個部門在特定業務領域的特殊需求而設計的。數據和程序是相互依賴的,數據缺乏足夠的獨立性。

(2)數據沒有集中管理機制,無法保證其安全性和完整性,數據維護業務仍由應用承擔;

(3)數據的組織仍然是面向程序的,數據高度依賴於程序。數據的邏輯結構不能輕易修改和擴展,數據邏輯結構的每壹個細微變化都會影響到應用程序;而且文件之間缺乏聯系,無法反映現實世界事物之間的聯系。另外,操作系統不負責維護文件之間的連接,信息導致每個應用都有對應的文件。如果文件之間存在內容連接,只能由應用程序處理,有可能相同的數據在多個文件中重復存儲。這兩者都造成了大量的數據冗余。

(4)現有數據文件難以擴展和移植,增加或刪除數據項難以適應新的應用需求。

數據庫系統階段:

20世紀60年代末,隨著計算機在數據管理領域的廣泛應用,人們對數據管理技術提出了更高的要求:希望為企業或部門組織數據,減少數據冗余,提供更高的數據享受能力,同時要求程序和數據具有更高的獨立性。當數據的邏輯結構發生變化時,不涉及數據的物理結構,也不影響應用程序,從而降低應用程序開發和維護的成本。數據庫技術就是在這樣的應用需求基礎上發展起來的。

綜上所述,數據庫系統階段的數據管理具有以下特點:

(1)用數據模型表示復雜的數據結構。數據模型不僅描述了數據本身的特征,還描述了數據之間的關系,數據通過所有的訪問路徑。通過所有存儲路徑表示自然的數據連接是數據庫和傳統文件的根本區別。這樣,數據不再面向特定的壹個或多個應用程序,而是面向整個應用系統。比如對於企業或部門,以數據為中心組織數據,形成壹個綜合的數據庫,供所有應用享用。

(2)面向整個應用系統,數據冗余小,易於修改和擴展,實現數據貢獻。不同的應用根據處理需求從數據庫中獲取所需的數據,減少了數據的重復存儲,便於添加新的數據結構和維護數據的壹致性。

(3)數據的統壹管理和控制提供了數據的安全性、完整性和並發控制。

(4)程序和數據高度獨立。數據的邏輯結構和物理結構差別可以很大,用戶可以用簡單的邏輯結構操作數據,而不用考慮數據的物理結構。

(5)有了良好的用戶界面,用戶可以方便地開發和使用數據庫。

從文件系統到數據庫系統的發展是信息領域的壹個裏程碑。在文件系統階段,人們在信息處理中關註的中心問題是系統功能的設計,所以程序設計占主導地位;在數據庫模式下,數據開始占據中心位置,數據結構的設計成為信息系統首先關註的問題,而應用程序則是基於既定的數據結構來設計的。

數據庫發展趨勢:

隨著信息管理內容的不斷擴展,各種數據模型(層次模型、網格模型、關系模型、面向對象模型、半結構化模型等。)已經出現,新技術(數據流、Web數據管理、數據挖掘等。)紛紛湧現。每隔幾年,壹些國際資深數據庫專家會聚在壹起討論數據庫研究的現狀、存在的問題以及未來需要關註的新技術焦點。過去幾個類似的報告包括:1989 future direction sind DBMS research-the laguna beach參與者;1990數據庫系統:成就和機遇;1991 W . h . inmon出版的《構建數據倉庫》;1995數據庫。

常見的數據庫供應商:

1.SQLServer

它只能在沒有任何開放性的windows上運行,操作系統的穩定性對數據庫至關重要。Windows9X系列產品以桌面應用為主,NTserver只適合中小企業。和wi

  • 上一篇:為什麽收音機收不到這個節目?
  • 下一篇:靈溪壹中的成就
  • copyright 2024吉日网官网