Класифікація бд: варіанти, моделі даних і основні характеристики

Як БД позначається набір даних, які необхідно впорядкувати, а система управління базою даних (СУБД) відповідає за її адміністрування, визначаючи, таким чином, структуру, порядок, права доступу і залежності. Для цієї мети використовується власний компілятор і відповідна модель, яка визначає архітектуру системи бази даних. На базі архітектури проводять класифікацію БД.

Історія створення

Бази даних (БД) являють собою логічно структуровані системи для електронного адміністрування, яке проводиться за допомогою системи управління базами даних (СУБД), додавши її в репозиторій. Більшість БД можна відкривати, редагувати та консультувати лише за допомогою конкретних програм. За цими принципами виконують класифікацію БД. У 1960-х роках концепція електронної інформаційної бази стала розроблятися як окремий шар програмного забезпечення між ОС і прикладною програмою.

Ідея системи електронних БД стала одним з найбільш актуальних нововведень в комп`ютерних розробках. Першими моделями, які були розроблені, були ієрархічні та мережеві бази даних. IBM в сімдесятих зробила революцію в цьому секторі, з розробкою моделі реляційних БД. Найуспішнішими продуктами на той час були мова запитів БД Oracle SQL та наступники IBM, SQL / DS та DB2.

Поняття БД і класифікація БД

Сьогодні системи баз даних мають важливе значення в багатьох галузях науки, техніки та застосування користувачів. Будь-який тип програмне забезпечення, розроблений для компаній, заснований на надійних БД з великою кількістю опцій і інструментів для системних адміністраторів. Безпека даних також набуває все більшого значення, в електронних БД зберігаються і шифруються паролі, особисті дані і навіть електронні валюти.

Сучасна фінансова система являє собою не що інше, як мережу баз даних, в якій велика частина грошових сум існує тільки у вигляді електронних одиниць інформації, захист яких за допомогою безпечних БД є однією з основних завдань фінансових установ.

Поняття БД і класифікація БД

Залежно від мінливості бази даних її тип відносять за класифікацією БД до статичного або динамічного.

Функції статичних БД:

  1. Дозволяють тільки читання даних, виключаючи модифікацію.
  2. Застосовуються для біографій та історичних фактів або сценаріїв, до яких можна звертатися для дослідження, без необхідності зміни змісту.
  3. Вони безпечні і прості у використанні при підключенні до мережі.

Функції динамічних БД:

  1. Вони володіють поняттям самоврядування.
  2. Можуть бути пов`язані з динамічними мережами.
  3. Ця структурна Асоціація дозволяє зберігати та оновлювати інформацію бази даних.
  4. Використовує HTML як мову зв`язку між мережею та динамічною БД.
  5. Найбільш використовувані мови для створення динамічних мереж, пов`язаних з BBDD: Perl, CGI, PHP, JSP і ASP.

Основними СУБД, які працюють з динамічними веб - сторінками, є PostgresQL, MySQL, Oracle та Microsoft SQL.

Для того щоб зрозуміти, які існують варіанти класифікації БД, що використовуються в науковому та освітньому середовищі, розглядають:

  • бібліографічний;
  • документальний;
  • спеціалізований;
  • довідник.

Функціональні можливості бібліографічних БД:

  1. Пов`язані зі старими записами, які містять інформацію про місцезнаходження книги або документа.
  2. Не містять повний текст, тільки посилання.
  3. Завдяки таким форматам, як PDF, дозволяє отримувати доступ до оригінальних статей, на які є посилання.
  4. З розвитком технологій включаються посилання з інших ЗМІ.

Особливості спеціалізованих БД:

  1. Містять точну інформацію і орієнтовані на конкретну тему.
  2. Використовуються в академічному та науковому середовищі.
  3. Для деяких випадків не розглядаються як правильні BBDD: наприклад, Телефонний довідник, список контактів компанії або міжнародної компанії.

Моделі електронної обробки

Для того щоб детально вивчити питання, які існують варіанти класифікації БД, не можна обійти тему моделей. Ієрархічні бази даних були першими, розробленими в 60-х роках в працях Холлеріта, вони залежали від типу зберігання інформації 1N / NN в формі перевернутого дерева.

Відносини мають тип 1N, коли батьківський вузол може мати кілька дочірніх підвузлів, але дочірній вузол не може належати кільком батьківським. Їх недоліком є те, що надмірність даних представлена не дуже добре.

Модель бази даних в мережі, запропонована CODASYL, є його першою системою управління (IMS), з`явилася вона в 1968 році для програми НАСА "Аполлон". Вона вирішувала деякі проблеми попередньої ієрархічної моделі, які вже практично не використовуються в сучасному IT-процесі.

Для того щоб зрозуміти сучасну модель, потрібно розглянути, які в класифікації БД існують відносини між батьківськими і дочірніми вузлами. Сьогодні використовуються відносини типу NN, коли дочірньому підвузлу дозволено належати декільком батьківським вузлам. Разом з ієрархічною моделлю вона формує перше покоління БД.

Переваги моделі: вони пропонують відмінну стабільність, хорошу продуктивність і кращу Надмірність обробки. Недоліком моделі є складність системи, яка вимагає знань в області програмування.

Особливості транзакційних баз даних:

  1. Єдина мета-надсилання та отримання даних з високою швидкістю.
  2. Вони націлені на якісний аналіз і виробничі дані.
  3. Унікальним призначенням є збір і відновлення даних з максимально можливою швидкістю, тому надмірність і дублювання інформації не є проблемою, як з іншими БД.
  4. Дозволяють з`єднання з реляційними БД.
  5. Операції є атомними, в цьому типі можливо тільки те, що вони виконуються повністю (цілісність) або не виконуються взагалі.

Основні відмінності в базах даних

Документальні-повертають вміст, працюють з когнітивними та концептуальними документами, належать до інтелектуального та академічного середовища. У них є менеджери документів і контенту, такі, як CDS / ISIS, Filemaker, Knosys або Imagic Text для термінологічного контролю. Вони легкодоступні при використанні стандартизованих мов запитів і мають класифікацію БД за типом моделі даних.

Реляційні засновані на встановленні зв`язків між наборами даних, організовані у вигляді таблиць, які відповідають деяким основним вимогам. Вони мають фіксовану кількість полів. Кожен атрибут має назву та багато можливих значень. Кожен запис унікальний і ідентифікується за допомогою ключа. Вони реалізують мову запитів SQL і базуються на моделі, розробленій Едгаром Коддом у 70-х.

Золоте правило

Об`єктно орієнтовані бази даних повертають фізичні файли або програмний код, з`явилися вони в кінці ХХ століття. Використовуються в промисловому виробництві та дизайні. Працюють з об`єктно орієнтованою мовою, такою як C++ або Python. Дотримуватися "золоте правило": постійність, менеджер вторинного сховища, паралельність, відновлення та об`єкт запиту.

Системи управління СУБД

Системи управління СУБД

Система управління базами даних (СУБД) - термін для опису функцій і вимог транзакцій в системі управління БД, скорочено це ACID (АСІД) від атомарності, узгодженості, ізоляції і довговічності. Ці чотири параметри охоплюють найважливіші вимоги до СУБД, сумісні з ACID:

  1. Atomicity (атомарність) позначає властивість "все або нічого" менеджерів БД для того, щоб запит був дійсним, транзакція була виконана правильно і реалізована з вірним порядком процедур.
  2. Консистенція, або когерентність, коли операція БД залишається стабільною, що вимагає постійного контролю всіх операцій.
  3. Ізоляція є умовою та гарантією того, що транзакції не заважають одна одній, що зазвичай досягається блокуванням певних функцій, які ізолюють дані, що беруть участь у торгівлі.
  4. Довговічність означає, що в СУБД всі дані зберігаються в довгостроковій перспективі навіть після укладення угоди, а також в разі аварії системи, якщо падає СУБД. Задля цієї умови необхідні записи транзакцій, які протоколюють всі процеси, що відбуваються.

Класифікація функцій і вимог

База даних зберігає інформацію та пов`язує її в логічну одиницю разом із метаданими, необхідними для обробка. Це дуже корисний інструмент для управління великими файлами з простим запитом, що володіє системою дозволів, яка визначає, які користувачі або Програми мають право доступу.

Класифікація функцій і вимог

Класифікація БД:

Функція

Призначення

Зберігати дані

У БД зберігаються Тексти, документи, паролі. В електронному форматі, доступ до даних можна отримати через консультації.

Змінити Дані

Залежно від того, які дозволи доступні, більшість БД дозволяють редагувати фільтри захисту даних.

Очистити дані

Записи в більшості варіантів класифікації БД можуть бути повністю видалені, не залишаючи пробілів. У деяких випадках видалені дані можуть бути відновлені, але в інших вони видаляються назавжди.

Управління метаданими

Зазвичай інформація зберігається з метаданими або метатегами, які підтримують порядок в БД і роблять можливою функцію пошуку. Метадані також часто використовуються для регулювання дозволів.

Безпека даних

БД повинні бути захищені, щоб запобігти доступу несанкціонованих осіб до інформації, яку вони зберігають.

Цілісність даних

Цілісність даних означає, що вони повинні відповідати певним правилам для забезпечення їх коректності та визначення бізнес-логіки банку даних.

Багатокористувацька функція

Додатки БД забезпечують доступ з різних пристроїв. Розподіл дозволів та безпека даних є елементарними в багатокористувацькому використанні.

Оптимізувати запити

Технічно БД повинна бути в змозі обробляти запити найкращим чином, щоб гарантувати хорошу продуктивність.

Тригери та збережені процедури

Ці дві процедури є міні-додатками, що зберігаються в СУБД. Тригери та збережені процедури є типовими процесами реляційних баз даних.

Прозорість системи

Прозорість системи актуальна, особливо в розподілених моделях класифікації БД.

Ієрархічна модель

Ієрархічна модель

Відмінності між найбільш поширеними моделями БД є результатом технічної еволюції електронної передачі даних, яка не тільки переслідувала цілі ефективності і керованості, але також розширювала можливості найбільш відомих виробників. Це найстаріша модель, яка сьогодні значно перевершує реляційну, хоча останнім часом спостерігається зростання її популярності.

XML використовує цю систему для зберігання інформація. Деякий страхові компанії і банки звертаються до ієрархічних баз даних у найстаріших додатках. Найбільш відома-це база IBM IMS / DB.

В ієрархічній моделі класифікації даних БД існують суворі та однозначні залежності. Кожен запис має тільки один прецедент (Parent-Child Relationships, PCR), за винятком кореня (root), що становить деревоподібну схему. Хоча кожен дочірній вузол може мати лише одного батьківського, "батьки" можуть мати стільки дочірніх вузлів, скільки хочуть.

Враховуючи суворе ієрархічне впорядкування, рівні, які не мають прямого зв`язку, не взаємодіють один з одним, тому з`єднати два різних дерева непросто. При цьому ієрархічні структури баз даних надзвичайно гнучкі і зрозумілі. Записи з "діти" називаються записами, а ті, які без, - листям, і зазвичай є документами в записі для листя в класифікації БД. Запити до ієрархічної бази даних досягають листя, починаючи з кореня і проходячи через різні записи.

Графічно орієнтована DMS

Мережева модель розвивалася майже одночасно з реляційною, хоча з часом вона була переможена конкурентами. На відміну від ієрархічної моделі тут записи не розкривають строгих відносин "батько-нащадок", але кожна може мати кілька прецедентів, що дає їй мережеву структуру свого імені. Для доступу до запису також існує унікальний і незмінний шлях.

У моделі мережевої бази даних немає фіксованої ієрархії, і тому існує кілька шляхів, що ведуть до одного пункту призначення. Запис, розташований у центрі зображення, теоретично може бути доступний з п`яти інших, і, отримавши доступ до нього, можна отримати доступ до п`яти інших записів.

У мережевій моделі також можуть бути визначені залежності-регістр, розташований вище. Він не пов`язаний безпосередньо з регістром в крайньому правому положенні, тому для його досягнення повинен проходити через регістр в центрі, який може прийняти або відхилити. Можна зв`язатися з розташованим зліва вгорі. У мережевій моделі записи додаються або видаляються без впливу на глобальну структуру.

Сьогодні ця модель використовується на великих комп`ютерах. В інших областях все ще покладаються на ієрархічну модель або звертаються до реляційної моделі, набагато гнучкішої та простішої у використанні. Деякі відомі моделі мережевих баз даних - це UDS Siemens та DMS Sperry Univac. З часом обидва виробники також розробили цікаві змішані форми між мережевою моделлю та реляційною. Графічно орієнтована база даних завдяки своїй ретикулярній структурі вважається сучасною еволюцією мережевої моделі.

Графічно орієнтована DMS Sperry Univac

Масштабованість сховищ

У документноорієнтованій моделі бази даних документи є основною одиницею зберігання інформації. Ці одиниці-це ті, що структурують дані, і їх не слід плутати з документами програм обробки текстів. Тут дані зберігаються в так званих парах "ключ-значення".

Оскільки ні структура, ні кількість пар не визначені, документи, що складають базу даних, орієнтовану на документи, можуть сильно відрізнятися один від одного. Кожен документ сам по собі є закритою одиницею, і встановити відносини між документами непросто.

В останні роки завдяки успіху NoSQL документарні бази даних пережили великий бум, особливо завдяки хорошій масштабованості. Прикладом системи баз даних цього типу є MongoDB. У моделі бази даних, орієнтованої на документи, дані зберігаються в окремих документах, а не в таблицях, як у реляційній моделі.

Ці системи особливо цікаві для веб-додатків, оскільки вони дозволяють зберігати повні HTML-форми. Необхідно підкреслити, що серед різних систем на основі документів є помітні відмінності-від синтаксису до внутрішньої структури, тому не всі бази даних, орієнтовані на документи, підходять для цього сценарію. Саме через ці відмінності існує кілька систем баз даних, орієнтованих на документи репутації Lotus Notes, Amazon SimpleDB, MongoDB, CouchDB, Riak, ThruDB та OrientDB.

Переваги та недоліки

Переваги та недоліки

Належні системи управління базами даних допомагають отримати кращий доступ до даних, а також оптимізувати управління ними. У свою чергу, точковий доступ допомагає кінцевим користувачам швидко і ефективно обмінюватися даними в рамках виконання завдань організації.

Модель бази даних

Рік створення

Перевага

Недостатки

Ієрархічний

1960-й

Дуже швидкий доступ для читання, чітка структура, технічно простий.

Виправлена структура в дереві, яка не допускає зв`язку між деревами.

Мережний

Початок 1970-х

Підтримувати кілька способів доступу до запису, без суворої ієрархії.

Поганий огляд з великими базами даних.

Реляційна

1970-й

Просте, гнучке створення та редагування, легко розширюване, швидке введення в експлуатацію, просте розширення, Швидкий запуск, дуже динамічний контекст.

Некерований з великими обсягами даних, поганою сегментацією, атрибутами штучного ключа, зовнішнім інтерфейсом програмування, погано відображає властивості і поведінку об`єктів.

Орієнтована на об`єкти

Кінець 1980-х

Краща підтримка об`єктноорієнтованих мов програмування, зберігання мультимедійного контенту. Підтримувати об`єктноорієнтовані мови програмування, дозволяє зберігати мультимедійний контент.

Більш низька продуктивність з великими обсягами даних, мало сумісних інтерфейсів.

Орієнтована на документи

1980-е

Відповідні дані зберігаються централізовано в незалежних документах, вільній структурі, концепції Мультимедіа, відноситься до класифікації сутностей БД.

Організаційна робота відносно висока, часто вимагає навичок програмування.

Галузь застосування

Галузь застосування

Людина можете не усвідомлювати цього, але бази даних є скрізь. Незалежно від того, знає він про них щось чи ні, їх вплив на повсякденне життя дуже великий. Від погодних додатків до фільмів онлайн, бази даних відповідають за багато послуг, якими люди користуються щодня, і щоб не заплутатися в зрослому обсязі інформації, використовують класифікацію даних в БД.

Області застосування СУБД:

  1. Банківська справа - для інформації про клієнтів, рахунків і позик, а також банківських операцій.
  2. Авіакомпанії - для бронювання та інформації про розклад. Авіакомпанії були одними з перших, хто використовував бази даних у географічно розподіленому порядку: термінали, розташовані по всьому світу, отримували доступ до центральної системи баз даних через телефонні лінії та інші мережі передачі даних.
  3. Університети - для інформації про студентів, реєстрації курсів та оцінок.
  4. Операції з кредитними картками - для покупок за кредитними картками та формування щомісячних виписок.
  5. Телекомунікації - для ведення записів про здійснені виклики, складання щомісячних рахунків, підтримання балансу на телефонних картках з передоплатою та зберігання інформації про мережі зв`язку.
  6. Фінанси-для зберігання інформації про запаси, продажах і покупках фінансових інструментів, таких, як акції та облігації.
  7. Продажі - інформація про клієнта, продукт та покупку.
  8. Виробництво-для управління ланцюгом поставок і для відстеження виробництва товарів на фабриках, запасів товарів на складах, в магазинах і замовлень на товари.
  9. Людські ресурси-для отримання інформації про працівників, заробітну плату, податки на заробітну плату та пільги, а також для отримання зарплат.

Майбутні тенденції

Майбутні тенденції

У майбутньому світогляді баз даних як і раніше важливим аспектом буде залишатися World Wide Web (WWW, або, в скороченому вигляді, веб) як засіб публікації документів і як засіб обміну інформацією. WWW надає одну з найбільш різнорідних і складних середовищ в області взаємодії.

Останнім часом з`явилися технології та стандарти, спрямовані на те, щоб зробити мережу масштабованою та керованою інфраструктурою. Однією з таких технологій є XML, яка перетворена в Інтернет, в систему бази даних, в стилі обробників традиційної БД, яка дає набагато кращі результати, ніж машини пошуку. Завдання полягає в тому, щоб інтегрувати цю функціональність у XML та максимально використовувати стратегічну інформацію, яку користувач може знайти в Інтернеті.

Новими тенденціями є проактивний та прогнозний аналіз продуктивності, тестування навантаження на базу даних, використання NOSQL-mongodb та cassandra та BigData (Hadoop) у корпоративних та хмарних середовищах.

Статті на тему