Основные сведения о базах данных

Эта статья содержит краткие сведения о базах данных: что это, чем они могут быть полезны, каковы функции их отдельных элементов. Здесь используется терминология, свойственная Microsoft Access, однако описываемые понятия применимы по отношению к любым базам данных.

В этой статье:

  • Что такое база данных?

  • Элементы базы данных Access

Что представляет собой база данных?

База данных — это инструмент для сбора и у организатора сведений. В базах данных могут храниться сведения о товарах, товарах, заказах и других данных. Многие базы данных начинаются с списка в word-processing program или spreadsheet. По мере роста списка в данных появляются избыточные и несоответствия. Данные становится трудно понять в форме списка, и существует ограниченный способ поиска или вывода подмног данных для проверки. Когда эти проблемы начнут появляться, лучше перенести данные в базу данных, созданную системой управления базами данных (СУБД), такой как Access.

Компьютерная база данных — это хранилище объектов. В одной базе данных может быть больше одной таблицы. Например, система отслеживания складских запасов, в которой используются три таблицы, — это не три базы данных, а одна. В базе данных Access (если ее специально не настраивали для работы с данными или кодом, принадлежащими другому источнику) все таблицы хранятся в одном файле вместе с другими объектами, такими как формы, отчеты, макросы и модули. Для файлов баз данных, созданных в формате Access 2007 (который также используется в Access 2016, Access 2013 и Access 2010), используется расширение ACCDB, а для баз данных, созданных в более ранних версиях Access, — MDB. С помощью Access 2016, Access 2013, Access 2010 и Access 2007 можно создавать файлы в форматах более ранних версий приложения (например, Access 2000 и Access 2002–2003).

Использование Access позволяет:

  • добавлять новую информацию в базу данных, например новый артикул складских запасов;

  • изменять информацию, уже находящуюся в базе, например перемещать артикул;

  • удалять информацию, например если артикул был продан или утилизирован;

  • упорядочивать и просматривать данные различными способами;

  • обмениваться данными с другими людьми с помощью отчетов, сообщений электронной почты, внутренней сети или Интернета.

Элементы базы данных Access

Ниже приведены краткие описания элементов стандартной базы данных Access.

  • Таблицы

  • Формы

  • Отчеты

  • Запросы

  • Макросы

  • Модули

Таблицы

Таблица базы данных похожа на электронную таблицу — и там, и там информация расположена в строках и столбцах.

Поэтому импортировать электронную таблицу в таблицу базы данных обычно довольно легко. Основное различие заключается в том, как данные структурированы.

Чтобы база данных была как можно более гибкой и чтобы в ней не появлялось излишней информации, данные должны быть структурированы в виде таблиц. Например, если речь идет о таблице с информацией о сотрудниках компании, больше одного раза вводить данные об одном и том же сотруднике не нужно. Данные о товарах должны храниться в отдельной таблице, как и данные о филиалах компании. Этот процесс называется нормализацией.

Строки в таблице называются записями. В записи содержатся блоки информации. Каждая запись состоит по крайней мере из одного поля. Поля соответствуют столбцам в таблице. Например, в таблице под названием «Сотрудники» в каждой записи находится информация об одном сотруднике, а в каждом поле — отдельная категория информации, например имя, фамилия, адрес и т. д. Поля выделяются под определенные типы данных, например текстовые, цифровые или иные данные.

Еще один способ описания записей и полей — визуализация старого стиля каталога карток библиотеки. Каждая карточка в карточке соответствует записи в базе данных. Каждый фрагмент сведений на отдельной карточке (автор, заголовок и так далее) соответствует полю

в базе данных.

Дополнительные сведения о таблицах см. в статье Общие сведения о таблицах.

Формы

С помощью форм создается пользовательский интерфейс для ввода и редактирования данных. Формы часто содержат кнопки команд и другие элементы управления, предназначенные для выполнения различных функций. Можно создать базу данных, не используя формы, если просто отредактировать уже имеющуюся информацию в таблицах Access. Тем не менее, большинство пользователей предпочитает использовать формы для просмотра, ввода и редактирования информации в таблицах.

С помощью кнопок команд задаются данные, которые должны появляться в форме, открываются прочие формы и отчеты и выполняется ряд других задач. Например, есть «Форма клиента», в которой вы работаете с данными о клиентах. И в ней может быть кнопка, нажатием которой открывается форма заказа, с помощью которой вы вносите информацию о заказе, сделанном определенным клиентом.

Формы также дают возможность контролировать взаимодействие пользователей с информацией базы данных. Например, можно создать форму, в которой отображаются только определенные поля и с помощью которой можно выполнять только ограниченное число операций. Таким образом обеспечивается защита и корректный ввод данных.

Дополнительные сведения о формах см. в статье Формы.

Отчеты

Отчеты используются для форматирования, сведения и показа данных. Обычно отчет позволяет найти ответ на определенный вопрос, например «Какую прибыль в этом году принесли нам наши клиенты?» или «В каких городах живут наши клиенты?» Отчеты можно форматировать таким образом, чтобы информация отображалась в наиболее читабельном виде.

Отчет можно сформировать в любое время, и в нем всегда будет отображена текущая информация базы данных. Отчеты обычно форматируются таким образом, чтобы их можно было распечатать, но их также можно просматривать на экране, экспортировать в другие программы или вкладывать в сообщения электронной почты.

Дополнительные сведения об отчетах см. в статье «Обзор отчетов в Access».

Запросы

Запросы могут выполнять множество функций в базе данных. Одна из их основных функций — находить информацию в таблицах. Нужная информация обычно содержится в нескольких таблицах, но, если использовать запросы, ее можно просматривать в одной. Кроме того, запросы дают возможность фильтровать данные (для этого задаются критерии поиска), чтобы отображались только нужные записи.

Используются и так называемые «обновляемые» запросы, которые дают возможность редактировать данные, найденные в основных таблицах. При работе с обновляемым запросом помните, что правки вносятся в основные таблицы, а не только в таблицу запроса.

У запросов два основных вида: запросы на выборки и запросы на выполнение действий. Запрос на выборки просто извлекает данные и делает их доступными для использования. Вы можете просмотреть результаты запроса на экране, распечатать его или скопировать в буфер обмена. Вы также можете использовать выходные данные запроса в качестве источника записей для формы или отчета.

Запрос на изменение, как следует из названия, выполняет задачу с данными. С помощью запросов на изменения можно создавать новые таблицы, добавлять данные в существующие таблицы, обновлять или удалять данные.

Дополнительные сведения о запросах см. в статье Знакомство с запросами.

Макросы

Макросы в Access — это нечто вроде упрощенного языка программирования, с помощью которого можно сделать базу данных более функциональной. Например, если к кнопке команды в форме добавить макрос, то он будет запускаться всякий раз при нажатии этой кнопки. Макросы состоят из команд, с помощью которых выполняются определенные задачи: открываются отчеты, выполняются запросы, закрывается база данных и т. д. Используя макросы, можно автоматизировать большинство операций, которые в базе данных вы делаете вручную, и, таким образом, значительно сэкономить время.

Дополнительные сведения о макросах см. в статье Общие сведения о программировании в Access.

Модули

Подобно макросам, модули — это объекты, с помощью которых базу данных можно сделать более функциональной. Но если макросы в Access составляются путем выбора из списка макрокоманд, модули создаются на языке Visual Basic для приложений (VBA). Модули представляют собой наборы описаний, инструкций и процедур. Существуют модули класса и стандартные модули. Модули класса связаны с конкретными формами или отчетами и обычно включают в себя процедуры, которые работают только с этими формами или отчетами. В стандартных модулях содержатся общие процедуры, не связанные ни с каким объектом. Стандартные модули, в отличие от модулей класса, перечисляются в списке Модули в области навигации.

Дополнительные сведения о модулях см. в статье Общие сведения о программировании в Access.

К началу страницы

Сбор данных — SQL Server

  • Статья
  • Чтение занимает 5 мин

Применимо к:SQL Server

Сборщик данных является компонентом SQL Server , который собирает различные наборы данных. Сбор данных выполняется постоянно или по расписанию, назначенному пользователем. Собранные данные сборщик данных сохраняет в реляционной базе данных, называемой хранилищем данных управления.

Что такое сборщик данных

Сборщик данных является базовым компонентом платформы сбора данных SQL Server и средств, предоставляемых SQL Server. Он предоставляет единую централизованную точку сбора данных со всех серверов баз данных и приложений. Эта точка сбора может получать данные из множества источников и не ограничена сбором данных о производительности, в отличие от трассировки SQL.

Сборщик данных позволяет задавать область сбора данных в соответствии с требованиями тестовой и рабочей сред. Сборщик данных также использует хранилище данных, реляционную базу данных, которая предоставляет возможность управлять собираемыми данными, задавая различные сроки их хранения.

Сборщик данных поддерживает динамическую настройку сбора данных и его возможности можно расширить посредством API-интерфейса сборщика данных. Дополнительные сведения см. в статье Data Collector Programming.

Роль сборщика данных в общей стратегии сбора и управления данными в SQL Serverпоказана на следующем рисунке.

Основные понятия

Сборщик данных интегрирован с агентом SQL Server и службами Службы Integration Servicesи широко их использует. Поэтому перед началом работы со сборщиком данных необходимо изучить основные понятия, связанные с этими компонентами SQL Server .

Агент SQL Server используется для планирования и запуска заданий сбора. Обратите внимание на следующие основные понятия:

Дополнительные сведения см. в статье Автоматизированные задачи администрирования (агент SQL Server).

Службы Integration Services (Integration Services) используется для выполнения пакетов, которые собирают данные от отдельных поставщиков данных. Следует ознакомиться со следующими инструментами и понятиями служб Integration Services :

Дополнительные сведения см. в разделе Пакеты служб Integration Services (SSIS).

Терминология

target
Экземпляр компонента Компонент Database Engine в выпуске SQL Server , поддерживающем сбор данных. Дополнительные сведения о поддерживаемых выпусках см. в подразделе «Управляемость» раздела Возможности, поддерживаемые различными выпусками SQL Server 2016.

Целевой корневой элемент определяет поддерево в иерархии целей. Набор целей — это группа целей, получаемая в результате применения фильтра к поддереву, определенному целевым корневым элементом. Целевой корневой элемент может быть базой данных, экземпляром SQL Serverили экземпляром компьютера.

целевой тип
Тип цели, имеющий определенные характеристики и поведение. Например, цель — экземпляр SQL Server имеет характеристики, отличные от характеристик цели — базы данных SQL Server .

поставщик данных
Известный источник данных, предназначенный для типа целевого объекта, который поставляет данные типу сборщика.

тип сборщика
Логическая оболочка для пакетов служб Integration Services , которая обеспечивает реальные механизмы для сбора данных и передачи их в хранилище управляющих данных.

элемент сбора
Экземпляр типа сборщика. Элемент сбора создается с определенным набором входных свойств и частотой сбора.

набор элементов сбора
Группа элементов сбора. Набор сбора — это единица сбора данных, с которой пользователь может взаимодействовать через пользовательский интерфейс.

режим сбора
Способ, с помощью которого собираются и хранятся данные. В режиме сбора может применяться или не применяться кэширование. Режим с кэшированием обеспечивает непрерывный сбор, а режим без кэширования предназначен для нерегламентированного сбора или сбора моментального снимка.

Хранилище данных управления
Реляционная база данных, используемая для хранения собранных данных.

На следующем рисунке показываются зависимости и связи между компонентами сборщика данных.

Как показано на рисунке, поставщик данных расположен вне сборщика данных и по определению имеет явную связь с целью. Поставщик данных зависит от конкретной цели (например, служба SQL Server , такая как реляционный механизм) и предоставляет данные, такие как системные представления в SQL Server, счетчики системного монитора или поставщики инструментария WMI, которые могут быть использованы сборщиком данных.

Тип сборщика индивидуален для целевого типа и зависит от логической связи поставщика данных с целевым типом. Тип сборщика определяет, как данные будут собираться из конкретного поставщика данных (с помощью схематизированных параметров) и задает схему хранилища данных. Для хранения собранных данных необходимо наличие схемы поставщика данных и схемы хранилища. Тип сборщика также поставляет сведения о расположении хранилища управляющих данных, которое может располагаться на компьютере, выполняющем сбор данных, или на другом компьютере.

Показанный на рисунке элемент сбора — это экземпляр конкретного типа сборщика, параметризованный входными параметрами, например схемой XML типа сборщика. Все элементы сбора должны работать в одном и том же целевом корневом элементе либо в пустом целевом корневом элементе. Это дает сборщику данных возможность комбинировать типы сборщиков из операционной системы или из конкретного целевого корневого элемента, но не из разных целевых корневых элементов.

Элемент сбора имеет определенную частоту сбора, которая определяет, как часто будут собираться значения моментальных снимков. Хотя элемент сбора является строительным блоком набора сбора, самостоятельно он существовать не может.

Наборы сбора определяются и развертываются на экземпляре сервера и могут выполняться независимо друг от друга. Каждый набор сбора может быть применен к цели, которая подходит для целевых типов всех типов сборщика, являющихся частью этого набора сбора. Набор сбора выполняется заданием или заданиями агента SQL Server . Данные передаются в хранилище управляющих данных в соответствии с заранее установленным расписанием.

Все данные, собранные разными экземплярами внутри набора сбора, передаются в хранилище управляющих данных в соответствии с одним и тем же расписанием. Это расписание определяется, как общее расписание агента SQL Server и может быть использовано несколькими наборами сбора. Набор сбора включается и выключается как единая сущность; элементы сбора не могут включаться и выключаться индивидуально.

При создании или обновлении набора сбора можно настроить режим сбора, использующийся для сбора и передачи данных в хранилище управляющих данных. Тип расписания определяется типом режима сбора: с кэшированием или без кэширования. Если установлен режим сбора с кэшированием, то сбор и передача данных будут выполняться разными заданиями. Сбор выполняется по расписанию, которое запускается при запуске агента SQL Server , и работает с частотой, определенной в элементе сбора. Передача выполняется в соответствии с расписанием, заданным пользователем.

Если установлен режим сбора без кэширования, то сбор и передача данных будут выполняться одним заданием, но в два шага. Первый шаг — сбор, второй шаг — передача. Для сбора данных в нерегламентированном режиме расписание не требуется.

После включения набора сбора сбор данных может начаться либо в соответствии с расписанием, либо по запросу. После запуска сбора данных агент SQL Server создает процесс для сборщика данных, который, в свою очередь, загружает пакеты служб Службы Integration Services для набора сбора. Элементы сбора, представляющие типы сбора, собирают данные у соответствующих поставщиков данных указанных целей. После завершения цикла сбора эти данные загружаются в хранилище данных управления.

Возможные действия

ОписаниеРаздел
Управление разными аспектами сбора данных, например включением или отключением сбора данных, изменением конфигурации набора элементов сбора или просмотром данных в хранилище данных управления.Управление сбором данных
Использование отчетов для получения сведений о наблюдаемой системе и устранения неполадок ее производительности.Отчеты о наборе элементов сбора системных данных
Использование хранилища данных управления для сбора данных с сервера, который при сборе данных является целевым.Хранилище данных управления
Использование возможностей серверной трассировки приложения SQL Server Profiler для экспорта определения трассировки с целью создания набора элементов сбора, использующего общий тип сборщика трассировки SQL.Использование приложения SQL Server Profiler для создания набора элементов сбора трассировки SQL (среда SQL Server Management Studio)

7 Методы сбора данных в бизнес-аналитике

Данные генерируются с постоянно возрастающей скоростью. По данным Statista, в 2020 году общий объем данных составил 64,2 зеттабайта; по прогнозам, к 2025 году он достигнет 181 зеттабайта. Такое обилие данных может быть ошеломляющим, если вы не знаете, с чего начать.

Итак, как вы гарантируете, что используемые вами данные актуальны и важны для бизнес-задач, которые вы хотите решить? В конце концов, решение, основанное на данных, так же сильно, как и данные, на которых оно основано. Один из способов — собирать данные самостоятельно.

Вот разбивка типов данных, почему сбор данных важен, что нужно знать перед началом сбора и семь методов сбора данных, которые можно использовать.


Бесплатная электронная книга: руководство для начинающих по данным и аналитике

Получите доступ к бесплатной электронной книге уже сегодня.

СКАЧАТЬ СЕЙЧАС

Что такое сбор данных?

Сбор данных — это методологический процесс сбора информации о конкретном предмете. Крайне важно убедиться, что ваши данные являются полными на этапе сбора и что они собираются в соответствии с законом и этическими нормами. В противном случае ваш анализ будет неточным и может иметь далеко идущие последствия.

В общем, существует три типа данных о потребителях:

  • Первичные данные , которые собираются непосредственно от пользователей вашей организацией
  • Второстепенные данные , которые представляют собой данные о своих клиентах, предоставленные другой организацией (или собственные данные)
  • Сторонние данные , то есть данные, которые были собраны и сданы в аренду или проданы организациями, не имеющими связи с вашей компанией или пользователями

Несмотря на то, что есть варианты использования сторонних и сторонних данных, первичные данные (данные, которые вы собрали сами) более ценны, поскольку вы получаете информацию о том, как ваша аудитория ведет себя, думает и чувствует — все из надежного источника. .

Данные могут быть качественными (то есть контекстуальными по своей природе) или количественными (то есть числовыми по своей природе). Многие методы сбора данных применимы к любому типу, но некоторые лучше подходят для одного, чем для другого.

В жизненном цикле данных сбор данных является вторым этапом. После того, как данные сгенерированы, их необходимо собрать, чтобы они могли быть полезны вашей команде. После этого его можно обрабатывать, хранить, управлять, анализировать и визуализировать, чтобы помочь вашей организации в принятии решений.

Перед сбором данных необходимо определить несколько факторов:

  • Вопрос, на который вы хотите ответить
  • Субъекты данных, от которых вам необходимо собрать данные
  • Срок сбора
  • Метод(ы) сбора данных, наиболее подходящий для ваших нужд

Выбранный вами метод сбора данных должен основываться на вопросе, на который вы хотите ответить, типе необходимых данных, сроках и бюджете вашей компании.

Важность сбора данных

Сбор данных является неотъемлемой частью успеха бизнеса; это может позволить вам обеспечить точность, полноту и актуальность данных для вашей организации и решаемой проблемы. Собранная информация позволяет организациям анализировать прошлые стратегии и быть в курсе того, что необходимо изменить.

Информация, полученная из данных, поможет вам лучше понять усилия вашей организации и даст вам действенные шаги для улучшения различных стратегий — от изменения маркетинговых стратегий до оценки жалоб клиентов.

Принятие решений на основе неточных данных может иметь далеко идущие негативные последствия, поэтому важно доверять собственным процедурам и способностям сбора данных. Обеспечивая точный сбор данных, бизнес-профессионалы могут чувствовать себя в безопасности при принятии бизнес-решений.

Изучите варианты в следующем разделе, чтобы узнать, какой метод сбора данных лучше всего подходит для вашей компании.

7 Методы сбора данных, используемые в бизнес-аналитике

1.

Опросы

Опросы — это физические или цифровые анкеты, которые собирают как качественные, так и количественные данные от испытуемых. Одной из ситуаций, в которой вы можете провести опрос, является сбор отзывов участников после мероприятия. Это может дать представление о том, что понравилось посетителям, что они хотели бы изменить, и области, в которых вы можете улучшить или сэкономить деньги во время вашего следующего мероприятия для аналогичной аудитории.

В то время как бумажные копии опросов могут быть разосланы участникам, онлайн-опросы дают возможность широкомасштабного распространения. Они также могут быть недорогими; проведение опроса может ничего не стоить, если вы используете бесплатный инструмент. Если вы хотите ориентироваться на определенную группу людей, партнерство с фирмой, занимающейся исследованиями рынка, чтобы провести опрос перед этой демографической группой, может стоить денег.

При составлении и проведении опросов следует обращать внимание на влияние предвзятости, в том числе:

  • Предвзятость сбора : Может быть легко случайно написать вопросы опроса с предвзятостью. Следите за этим при создании вопросов, чтобы ваши испытуемые отвечали честно и не поддавались влиянию вашей формулировки.
  • Предвзятость субъекта : Поскольку ваши субъекты знают, что их ответы будут прочитаны вами, их ответы могут быть предвзятыми в сторону того, что кажется социально приемлемым. По этой причине рассмотрите возможность объединения данных опроса с поведенческими данными из других методов сбора, чтобы получить полную картину.

Связанный: 3 примера неверных вопросов в опросе и способы их исправления

2. Отслеживание транзакций

Каждый раз, когда ваши клиенты совершают покупку, отслеживание этих данных может позволить вам принимать решения о целевых маркетинговых усилиях и понимать ваша клиентская база лучше.

Часто платформы электронной коммерции и точек продаж позволяют хранить данные сразу после их создания, что делает этот метод сбора данных беспрепятственным, который может окупиться в виде информации о клиентах.

3. Интервью и фокус-группы

Интервью и фокус-группы состоят из личных бесед с субъектами на определенную тему или проблему. Интервью, как правило, проводятся один на один, а фокус-группы обычно состоят из нескольких человек. Вы можете использовать как для сбора качественных, так и для количественных данных.

С помощью интервью и фокус-групп вы можете получить отзывы от людей из вашей целевой аудитории о новых возможностях продукта. Наблюдение за тем, как они взаимодействуют с вашим продуктом в режиме реального времени, и запись их реакции и ответов на вопросы могут предоставить ценные данные о том, какие функции продукта следует развивать.

Как и в случае с опросами, эти методы сбора данных позволяют вам спрашивать субъектов все, что вы хотите, об их мнениях, мотивах и чувствах в отношении вашего продукта или бренда. Это также вводит потенциал для предвзятости. Старайтесь составлять вопросы, которые не ведут их в одном конкретном направлении.

Недостатком интервью и проведения фокус-групп является то, что они могут отнимать много времени и средств. Если вы планируете проводить их самостоятельно, это может быть длительный процесс. Чтобы избежать этого, вы можете нанять фасилитатора маркетинговых исследований для организации и проведения интервью от вашего имени.

4. Наблюдение

Наблюдение за людьми, взаимодействующими с вашим веб-сайтом или продуктом, может быть полезно для сбора данных из-за откровенности, которую оно предлагает. Если ваш пользовательский опыт сбивает с толку или сложен, вы можете увидеть это в режиме реального времени.

Тем не менее, организация сеансов наблюдения может быть сложной. Вы можете использовать сторонний инструмент для записи поездок пользователей по вашему сайту или наблюдения за взаимодействием пользователя с бета-версией вашего сайта или продукта.

Несмотря на то, что наблюдения менее доступны, чем другие методы сбора данных, они позволяют вам своими глазами увидеть, как пользователи взаимодействуют с вашим продуктом или сайтом. Вы можете использовать качественные и количественные данные, полученные из этого, чтобы внести улучшения и удвоить количество очков успеха.

5. Онлайн-отслеживание

Для сбора данных о поведении вы можете использовать пиксели и файлы cookie. Оба эти инструмента отслеживают онлайн-поведение пользователей на разных веб-сайтах и ​​дают представление о том, какой контент им интересен и с которым обычно взаимодействуют.

Вы также можете отслеживать поведение пользователей на веб-сайте вашей компании, включая то, какие части представляют наибольший интерес, не путаются ли пользователи при его использовании и сколько времени они проводят на страницах продуктов. Это может позволить вам улучшить дизайн веб-сайта и помочь пользователям перейти к месту назначения.

Вставка пикселя часто бесплатна и относительно проста в настройке. Внедрение файлов cookie может быть платным, но оно того стоит из-за качества данных, которые вы получите. После того, как пиксели и файлы cookie настроены, они собирают данные самостоятельно и не требуют особого обслуживания, если таковое требуется.

Важно отметить: отслеживание поведения в Интернете может иметь юридические и этические последствия для конфиденциальности. Прежде чем отслеживать поведение пользователей в Интернете, убедитесь, что вы соблюдаете местные и отраслевые стандарты конфиденциальности данных.

6. ​​Формы

Онлайн-формы полезны для сбора качественных данных о пользователях, особенно демографических данных или контактной информации. Они относительно недороги и просты в настройке, и вы можете использовать их для блокировки контента или регистраций, таких как вебинары и информационные бюллетени по электронной почте.

Затем вы можете использовать эти данные для связи с людьми, которые могут быть заинтересованы в вашем продукте, для создания демографических профилей существующих клиентов и для ремаркетинга, например для рабочих процессов по электронной почте и рекомендаций по контенту.

Связанный: Что такое маркетинговая аналитика?

7. Мониторинг социальных сетей

Мониторинг каналов вашей компании в социальных сетях на предмет вовлеченности подписчиков — это доступный способ отслеживания данных об интересах и мотивах вашей аудитории. Многие платформы социальных сетей имеют встроенную аналитику, но есть и сторонние социальные платформы, которые предоставляют более подробную и систематизированную информацию, полученную из нескольких каналов.

Вы можете использовать данные, собранные из социальных сетей, чтобы определить, какие проблемы наиболее важны для ваших подписчиков. Например, вы можете заметить, что количество обращений резко возрастает, когда ваша компания публикует сообщения о своих усилиях по обеспечению устойчивого развития.

Расширение возможностей работы с данными

Понимание различных доступных методов сбора данных может помочь вам решить, какой из них лучше всего подходит для ваших сроков, бюджета и вопроса, на который вы хотите ответить. При совместном хранении и объединении несколько типов данных, собранных с помощью разных методов, могут дать обоснованную картину ваших тем и помочь вам принимать более эффективные бизнес-решения.

Хотите стать профессионалом, работающим с данными? Исследуйте нашу восьминедельную программу Бизнес-аналитика и нашу программу Credential of Readiness (CORe) из трех курсов , чтобы углубить свои аналитические навыки и применить их к реальным бизнес-задачам. Не уверены, какой курс подходит именно вам? Загрузите нашу бесплатную блок-схему.

Это сообщение было обновлено 17 октября 2022 г. Первоначально оно было опубликовано 2 декабря 2021 г.

Что такое реляционная база данных?

Управление данными

К

  • Бен Луткевич, Технические характеристики Писатель
  • Жаклин Бискобинг, Старший управляющий редактор, Новости

Что такое реляционная база данных?

Реляционная база данных — это набор информации, который организует точки данных с определенными отношениями для легкого доступа. В модели реляционной базы данных структуры данных, включая таблицы данных, индексы и представления, остаются отдельными от структур физического хранилища, что позволяет администраторам баз данных редактировать физическое хранилище данных, не затрагивая логическую структуру данных.

На предприятии реляционные базы данных используются для организации данных и определения взаимосвязей между ключевыми точками данных. Они упрощают сортировку и поиск информации, что помогает организациям более эффективно принимать бизнес-решения и минимизировать затраты. Они хорошо работают со структурированными данными.

Как работает реляционная база данных?

Таблицы данных, используемые в реляционной базе данных, хранят информацию о связанных объектах. Каждая строка содержит запись с уникальным идентификатором, известным как ключ, а каждый столбец содержит атрибуты данных. Каждая запись присваивает значение каждой функции, что упрощает определение отношений между точками данных.

Стандартным интерфейсом пользователя и прикладной программы (API) реляционной базы данных является язык структурированных запросов. Операторы кода SQL используются как для интерактивных запросов информации из реляционной базы данных, так и для сбора данных для отчетов. Для обеспечения точности и доступности реляционной базы данных необходимо соблюдать определенные правила целостности данных.

Какова структура модели реляционной базы данных?

Э. Ф. Кодд, в то время молодой программист из IBM, изобрел реляционную базу данных в 1970. В своей статье «Реляционная модель данных для больших общих банков данных» Кодд предложил перейти от хранения данных в иерархических или навигационных структурах к организации данных в таблицах, содержащих строки и столбцы.

Каждая таблица, иногда называемая отношением, в реляционной базе данных содержит одну или несколько категорий данных в столбцах или атрибутах . Каждая строка, также называемая записью или кортежем , содержит уникальный экземпляр данных — или ключ — для категорий, определенных столбцами. Каждая таблица имеет уникальный первичный ключ, который идентифицирует информацию в таблице. Отношения между таблицами можно установить с помощью внешних ключей — поля в таблице, которое ссылается на первичный ключ другой таблицы.

Реляционная база данных включает таблицы, содержащие строки и столбцы.

Например, типичная база данных записей бизнес-заказов будет включать таблицу, описывающую клиента, со столбцами для имени, адреса, номера телефона и т. д. Другая таблица будет описывать заказ, включая такую ​​информацию, как продукт, клиент, дата и цена продажи.

Пользователь может получить отчет базы данных, содержащий необходимые ему данные. Например, менеджеру филиала может потребоваться отчет обо всех клиентах, купивших товары после определенной даты. Менеджер по финансовым услугам в той же компании может из тех же таблиц получить отчет о счетах, которые необходимо оплатить.

При создании реляционной базы данных пользователи определяют область возможных значений в столбце данных и ограничения, которые могут применяться к этому значению данных. Например, домен возможных клиентов может допускать до 10 возможных имен клиентов, но в одной таблице он ограничен возможностью указания только трех из этих имен клиентов.

Два ограничения относятся к целостности данных и первичным и внешним ключам:

  • Целостность объекта гарантирует, что первичный ключ в таблице уникален и его значение не равно нулю.
  • Ссылочная целостность требует, чтобы каждое значение в столбце внешнего ключа находилось в первичном ключе таблицы, из которой оно произошло.

Кроме того, реляционные базы данных обладают физической независимостью от данных. Это относится к способности системы вносить изменения во внутреннюю схему без изменения внешних схем или прикладных программ. Изменения внутренней схемы могут включать следующее:

  • использование новых запоминающих устройств;
  • изменение индексов;
  • переход с определенного метода доступа на другой;
  • с использованием разных структур данных; и
  • с использованием различных структур хранения или организации файлов.

Независимость от логических данных — это способность системы управлять концептуальной схемой без изменения внешней схемы или прикладных программ. Концептуальные изменения схемы могут включать добавление или удаление новых отношений, сущностей или атрибутов без изменения существующих внешних схем или переписывания прикладных программ.

Какие существуют типы баз данных?

Существует несколько категорий баз данных, от простых плоских файлов, которые не являются реляционными, до NoSQL и более новых графовых баз данных, которые считаются еще более реляционными, чем стандартные реляционные базы данных. Некоторые типы баз данных включают следующие:

База данных плоских файлов. Эти базы данных состоят из одной таблицы данных, между которыми нет взаимосвязи — обычно это текстовые файлы. Этот тип файла позволяет пользователям указывать атрибуты данных, такие как столбцы и типы данных.

Узнайте о преимуществах и недостатках плоских файлов и реляционных баз данных.

База данных NoSQL. Этот тип базы данных является альтернативой, которая особенно полезна для больших распределенных наборов данных. Базы данных NoSQL поддерживают различные модели данных, включая форматы «ключ-значение», «документ», «столбец» и «график».

Графическая база данных. Выход за рамки традиционных моделей реляционных данных на основе столбцов и строк; эта база данных NoSQL использует узлы и ребра, которые представляют связи между отношениями данных и могут обнаруживать новые отношения между данными. Графовые базы данных более сложны, чем реляционные базы данных. Они используются для обнаружения мошенничества или механизмов веб-рекомендаций.

Сравните графовые и реляционные базы данных.

Объектно-реляционная база данных (ORD). ORD состоит как из системы управления реляционной базой данных (RDBMS), так и из системы управления объектно-ориентированной базой данных (OODBMS). Он содержит характеристики моделей РСУБД и ООСУБД. Для хранения данных используется традиционная база данных. Затем к нему обращаются и манипулируют с помощью запросов, написанных на языке запросов, таком как SQL. Поэтому базовый подход ORD основан на реляционной базе данных.

Однако ORD также можно рассматривать как объектное хранилище, особенно для программного обеспечения, написанного на объектно-ориентированном языке программирования, что, таким образом, опирается на объектно-ориентированные характеристики. В этой ситуации для хранения и извлечения данных используются API.

См. характеристики РСУБД по сравнению с СУБД и их совпадение.

Каковы преимущества реляционных баз данных?

Ключевые преимущества реляционных баз данных включают следующее:

  • Классификация данных . Администраторы баз данных могут легко классифицировать и хранить данные в реляционной базе данных, которые затем можно запрашивать и фильтровать для извлечения информации для отчетов. Реляционные базы данных также легко расширяются и не зависят от физической организации. После создания исходной базы данных можно добавить новую категорию данных без изменения существующих приложений.
  • Точность . Данные сохраняются только один раз, исключая дедупликацию данных в процедурах хранения.
  • Простота использования. Пользователям легко выполнять сложные запросы с помощью SQL, основного языка запросов, используемого в реляционных базах данных.
  • Сотрудничество. Несколько пользователей могут получить доступ к одной и той же базе данных.
  • Безопасность. Прямой доступ к данным в таблицах в СУБД может быть ограничен определенными пользователями.

Каковы недостатки реляционных баз данных?

К недостаткам реляционных баз данных относятся следующие:

  • Структура. Реляционные базы данных требуют большой структуры и определенного уровня планирования, поскольку столбцы должны быть определены, а данные должны правильно вписываться в довольно жесткие категории. Структура хороша в некоторых ситуациях, но создает проблемы, связанные с другими недостатками, такими как обслуживание и отсутствие гибкости и масштабируемости.
  • Проблемы с обслуживанием. Разработчики и другой персонал, отвечающий за базу данных, должны тратить время на управление и оптимизацию базы данных по мере добавления в нее данных.
  • Негибкость. Реляционные базы данных не идеальны для обработки больших объемов неструктурированных данных. Данные, которые в значительной степени являются качественными, трудно определяемыми или динамическими, не являются оптимальными для реляционных баз данных, потому что по мере изменения или развития данных схема должна развиваться вместе с ними, что требует времени.
  • Отсутствие масштабируемости . Реляционные базы данных плохо масштабируются по горизонтали в физических структурах хранения с несколькими серверами. Трудно управлять реляционными базами данных на нескольких серверах, потому что по мере того, как набор данных становится больше и более распределенным, структура нарушается, а использование нескольких серверов влияет на производительность (например, время отклика приложений) и доступность.

Примеры реляционных баз данных

Стандартные реляционные базы данных позволяют пользователям управлять предопределенными отношениями данных между несколькими базами данных. Популярные примеры стандартных реляционных баз данных включают Microsoft SQL Server, Oracle Database, MySQL и IBM DB2.

Облачные реляционные базы данных или база данных как услуга также широко используются, поскольку они позволяют компаниям передавать на аутсорсинг обслуживание базы данных, установку исправлений и поддержку инфраструктуры. Облачные реляционные базы данных включают Amazon Relational Database Service, Google Cloud SQL, IBM DB2 on Cloud, SQL Azure и Oracle Cloud.

В чем разница между реляционными базами данных, нереляционными базами данных и NoSQL?

Наиболее важное различие между системами реляционных баз данных и системами нереляционных баз данных заключается в том, что реляционные базы данных нормализованы. То есть они хранят данные в табличной форме, организованной в виде таблицы со строками и столбцами. Нереляционная база данных хранит данные в виде файлов.

Другие отличия включают следующее:

  • Использование первичных ключей. Каждая таблица реляционной базы данных имеет идентификатор первичного ключа. В нереляционной базе данных данные обычно хранятся в иерархической или навигационной форме без использования первичных ключей.
  • Отношения значений данных. Поскольку данные в реляционной базе данных хранятся в таблицах, связь между этими значениями данных также сохраняется. Поскольку нереляционная база данных хранит данные в виде файлов, между значениями данных нет никакой связи.
  • Ограничения целостности. В реляционной базе данных ограничениями целостности являются любые ограничения, обеспечивающие целостность базы данных. Они определены с целью атомарности, согласованности, изоляции и долговечности или ACID. Нереляционные базы данных не используют ограничения целостности.
  • Структурированные и неструктурированные данные. Реляционные базы данных хорошо работают со структурированными данными, которые соответствуют предопределенной модели данных и мало изменяются. Нереляционные базы данных лучше подходят для неструктурированных данных, которые не соответствуют предопределенной модели данных и не могут храниться в СУБД. Примеры неструктурированных данных включают текст, электронные письма, фотографии, видео и веб-страницы.
Реляционные и нереляционные базы данных имеют уникальные сильные и слабые стороны.

Нереляционные базы данных также называются базами данных NoSQL. Термины используются взаимозаменяемо, но есть различия.

SQL — это язык запросов, который используется с реляционными базами данных. Реляционные базы данных и их системы управления почти всегда используют SQL в качестве основного языка запросов. Базы данных NoSQL или не только SQL используют SQL и другие языки запросов. Например, программа управления базой данных NoSQL MongoDB использует документы, подобные JSON, для хранения и организации данных. (Технически он использует вариант вызова JSON BSON или двоичный JSON.)

Обозначение баз данных как нереляционных и реляционных приводит к их категоризации на основе их архитектуры, а обращение к ним как к базам данных SQL и NoSQL приводит к их классификации на основе языка запросов, будь то исключительно SQL или не только SQL. Часто реляционную базу данных можно назвать базой данных SQL, поскольку многие из них используют SQL, а нереляционные базы данных можно назвать базами данных NoSQL. NoSQL и нереляционные базы данных хорошо работают с более изменчивыми моделями данных, такими как инженерные детали и молекулярное моделирование, где данные постоянно меняются.

Как реляционные, так и нереляционные платформы баз данных имеют свои недостатки. Базы данных NewSQL стремятся обеспечить преимущества обоих типов, предлагая целостность данных и управление доступом к приложениям, которые предлагают реляционные базы данных, и горизонтальную масштабируемость, которую обеспечивают нереляционные платформы или платформы NoSQL.

Правильный выбор базы данных

Реляционные базы данных работают со структурированными данными с определенными отношениями, которые можно организовать в табличном формате. Однако выбор правильной архитектуры базы данных — это гораздо больше, чем просто выбор между реляционной и нереляционной базой данных. Тип используемых или разрабатываемых данных и приложений являются ключевыми факторами, которые следует учитывать. Узнайте о некоторых других факторах, которые следует учитывать при выборе модели базы данных для корпоративного приложения.

Некоторые инициативы требуют особого внимания при выборе программного обеспечения базы данных. Например, в инициативах IoT возникает проблема между SQL и NoSQL, а также между статическими и потоковыми данными. Узнайте, на что следует обращать внимание при выборе базы данных для проекта Интернета вещей.

Последнее обновление: июнь 2021 г.

Продолжить чтение О реляционной базе данных
  • Архитекторы программного обеспечения борются с наследием реляционных баз данных
  • Хранилище данных и озеро данных: основные отличия
  • Машина времени DBA и будущее данных
  • Графовая база данных и реляционная база данных: ключевые отличия
  • Сравнение баз данных NoSQL, чтобы помочь вам выбрать правильный магазин
Копать глубже в управлении базой данных
  • МонгоДБ

    Автор: Александр Гиллис

  • база данных (БД)

    Автор: Бен Луткевич

  • Сравнение СУБД и РСУБД: ключевые отличия

    Автор: Крейг Стедман

  • Сравнение типов баз данных NoSQL в облаке

    Автор: Курт Марко

Бизнес-аналитика

  • Wellthy добивается успеха в области аналитики с ThoughtSpot

    Платформа специалиста по аналитике самообслуживания значительно повысила эффективность организации здравоохранения после ее старого BI . ..

  • Обновление Tableau нацелено на совместную аналитику, рассказывание историй

    Первое обновление поставщика 2023 года делает истории данных доступными на сервере после того, как они изначально были запущены только в облаке. Кроме того,…

  • Tibco Spotfire нацелен на эффективность инициирования действий

    Последняя версия пакета бизнес-аналитики поставщика включает журналы действий, которые позволяют администраторам видеть, как конечные пользователи используют инструмент, который …

ПоискAWS

  • AWS Control Tower стремится упростить управление несколькими учетными записями

    Многие организации изо всех сил пытаются управлять своей огромной коллекцией учетных записей AWS, но Control Tower может помочь. Сервис автоматизирует …

  • Разбираем модель ценообразования Amazon EKS

    В модели ценообразования Amazon EKS есть несколько важных переменных. Покопайтесь в цифрах, чтобы убедиться, что вы развернули службу…

  • Сравните EKS и самоуправляемый Kubernetes на AWS Пользователи

    AWS сталкиваются с выбором при развертывании Kubernetes: запустить его самостоятельно на EC2 или позволить Amazon выполнить тяжелую работу с помощью EKS. См…

Управление контентом

  • 6 вариантов использования SharePoint Syntex

    Обнаружение файлов — один из самых популярных вариантов использования SharePoint Syntex. Но как еще вы можете его использовать? Вот посмотрите, как в реале…

  • Изучите основы управления цифровыми активами Системы

    DAM предлагают центральный репозиторий мультимедийных ресурсов и улучшают сотрудничество в маркетинговых командах. Однако пользователи могут…

  • Введение в SharePoint Syntex

    SharePoint Syntex — это набег Microsoft на все более популярный рынок контент-служб искусственного интеллекта. Это введение исследует …

ПоискOracle

  • Oracle ставит перед собой высокие национальные цели в области ЭУЗ с приобретением Cerner

    Приобретя Cerner, Oracle нацелилась на создание национальной анонимной базы данных пациентов — дорога, заполненная …

  • Благодаря Cerner Oracle Cloud Infrastructure получает импульс

    Oracle планирует приобрести Cerner в рамках сделки на сумму около 30 миллиардов долларов. Второй по величине поставщик электронных медицинских карт в США может вдохнуть новую жизнь в …

  • Верховный суд встал на сторону Google в иске о нарушении авторских прав на Oracle API

    Верховный суд постановил 6-2, что API-интерфейсы Java, используемые в телефонах Android, не подпадают под действие американского закона об авторском праве, положив конец …

ПоискSAP

  • SAP соглашается продать долю Qualtrics за 7,7 млрд долларов

    Продажа компанией SAP компании Qualtrics подходит к завершающей стадии: она продает акции на сумму 7,7 млрд долларов.