Содержание:
Чтобы лучше понять, как и почему появились технологии, которые мы используем сегодня, погрузимся в историю возникновения первых БД, СУБД и хранилищ данных.
База данных — это организованный набор данных, который управляется с помощью системы управления базами данных (СУБД).
CODASYL - Conference of Data Systems Language
Прототипом для этих первых стандартов БД стала разработка в 1963 году компьютерным подразделением General Electric сетевой базы данных Integrated Data Store (IDS).
Одновременно в 1960-х появляется концепция информационной экономики и прототипы BI – системы для принятия решений на основе необработанных данных.
В 1966 году для космической программы Аполлон компанией IBM была разработана первая промышленная СУБД - иерархическая система IMS (Information Management System), в задачу которой входила обработка спецификаций изделий для ракетоносителя «Сатурн-5» и шаттла «Аполлон».
Эдгар Франк «Тед» Кодд
В 1979 году выпущена первая версия РСУБД (реляционная система управления базами данных) Oracle Database на базе SQL, а в 1980 – СУБД dBASE, ставшая самой популярной среди всех существовавших в то время продуктов.
Схема «Снежинка»
В то же время Ховард Дреснер, позднее ставший аналитиком Gartner, вводит термин Business Intelligence как «концепции и методы для улучшения принятия бизнес-решений с использованием систем на основе бизнес-данных».
В 1996 году на ее базе была создана объектно-реляционная СУБД PostgreSQL.
Data Vault
В то же время в 2000 году Дэном Линстедтом представлена модель проектирования корпоративных хранилищ данных Data Vault, а в 2009 Ларсом Рённбеком и Олле Регардтом – якорное моделирование (Anchor Modeling).
В этот же период появляется тренд на перемещение инфраструктуры данных в облака, Data Science, машинное обучение.
Со временем рост объема генерируемой информации, поиск более гибких решений и масштабируемых технологий привели к эволюции архитектур данных от Data Lake и Data Fabric до гибких, гибридных Data Lakehouse и Mesh. Расскажем про каждую подробнее.