¿Qué son los datos?
Los datos son una colección de una pequeña unidad de información distinta. Se puede utilizar en una variedad de formas, como texto, números, medios, bytes, etc. Se puede almacenar en hojas de papel o en memorias electrónicas, etc.
La palabra 'Datos' se origina a partir de la palabra 'dato' que significa 'única pieza de información'. Es plural de la palabra datum.
En informática, los datos son información que se puede traducir en una forma para su movimiento y procesamiento eficiente. Los datos son intercambiables.
¿Qué es la base de datos?
A base de datos Es una colección organizada de datos, de modo que se pueda acceder a ellos y gestionarlos fácilmente.
Puede organizar los datos en tablas, filas, columnas e indexarlos para que sea más fácil encontrar información relevante.
Manejadores de bases de datos Cree una base de datos de tal manera que solo un conjunto de programas de software proporcione acceso a los datos a todos los usuarios.
El propósito principal La función de una base de datos es operar una gran cantidad de información mediante el almacenamiento, la recuperación y la gestión de datos.
Hay muchos sitios web dinámicos en la World Wide Web actualmente y que se manejan a través de bases de datos. Por ejemplo, un modelo que comprueba la disponibilidad de habitaciones en un hotel. Es un ejemplo de un sitio web dinámico que utiliza una base de datos.
Hay muchos bases de datos disponibles como MySQL, Sybase, Oracle, MongoDB, Informix, PostgreSQL, SQL Server, etc.
Las bases de datos modernas son administradas por el sistema de gestión de bases de datos (DBMS).
SQL o Lenguaje de consulta estructurado se utiliza para operar con los datos almacenados en una base de datos. SQL depende del álgebra relacional y del cálculo relacional de tuplas.
Se utiliza una estructura cilíndrica para mostrar la imagen de una base de datos.
Evolución de las Bases de Datos
La base de datos ha completado más de 50 años de viaje en su evolución desde un sistema de archivos planos hasta sistemas relacionales y relacionales de objetos. Ha pasado por varias generaciones.
La evolución
Basado en archivos
1968 fue el año en que se introdujeron las bases de datos basadas en archivos. En las bases de datos basadas en archivos, los datos se mantenían en un archivo plano. Aunque los archivos tienen muchas ventajas, existen varias limitaciones.
Una de las principales ventajas es que el sistema de archivos tiene varios métodos de acceso, por ejemplo, secuencial, indexado y aleatorio.
suma numerosa
Requiere una programación extensa en un lenguaje de tercera generación como COBOL, BASIC.
Modelo de datos jerárquico
1968-1980 fue la era de la base de datos jerárquica. El modelo de base de datos jerárquico destacado fue el primer DBMS de IBM. Se llamó IMS (Sistema de Gestión de la Información).
En este modelo, los archivos están relacionados de forma padre/hijo.
El siguiente diagrama representa el modelo de datos jerárquico. El círculo pequeño representa objetos.
Al igual que el sistema de archivos, este modelo también tenía algunas limitaciones como implementación compleja, falta de independencia estructural, no puede manejar fácilmente una relación de muchos a muchos, etc.
Modelo de datos de red
Carlos Bachman Desarrolló el primer DBMS en Honeywell llamado Integrated Data Store (IDS). Fue desarrollado a principios de la década de 1960, pero fue estandarizado en 1971 por el grupo CODASYL (Conferencia sobre Lenguajes de Sistemas de Datos).
En este modelo, los archivos están relacionados como propietarios y miembros, al igual que en el modelo de red común.
El modelo de datos de red identificó los siguientes componentes:
- Esquema de red (organización de base de datos)
- Subesquema (vistas de base de datos por usuario)
- Lenguaje de gestión de datos (procedimental)
Este modelo también tenía algunas limitaciones como la complejidad del sistema y la dificultad de diseño y mantenimiento.
Base de datos relacional
1970 - Presente: Es la era de las bases de datos relacionales y la gestión de bases de datos. En 1970, el modelo relacional fue propuesto por E.F. Codd.
El modelo de base de datos relacional tiene dos terminologías principales llamadas instancia y esquema.
La instancia es una tabla con filas o columnas.
El esquema especifica la estructura como nombre de la relación, tipo de cada columna y nombre.
Este modelo utiliza algún concepto matemático como la teoría de conjuntos y la lógica de predicados.
La primera aplicación de base de datos de Internet se creó en 1995.
Durante la era de la base de datos relacional, se introdujeron muchos más modelos, como el modelo orientado a objetos, el modelo relacional de objetos, etc.
base de datos en la nube
La base de datos en la nube le permite almacenar, administrar y recuperar sus datos estructurados y no estructurados a través de una plataforma en la nube. Estos datos son accesibles a través de Internet. Las bases de datos en la nube también se denominan base de datos como servicio (DBaaS) porque se ofrecen como un servicio administrado.
Algunas de las mejores opciones en la nube son:
- AWS (servicios web de Amazon)
- Computación de copo de nieve
- Servicios en la nube de bases de datos Oracle
- servidor Microsoft SQL
- Llave de nube de Google
Ventajas de la base de datos en la nube
Costos mas bajos
Generalmente, la empresa proveedora no tiene que invertir en bases de datos. Puede mantener y soportar uno o más centros de datos.
Automatizado
Las bases de datos en la nube se enriquecen con una variedad de procesos automatizados, como recuperación, conmutación por error y escalado automático.
Mayor accesibilidad
Puede acceder a su base de datos basada en la nube desde cualquier ubicación y en cualquier momento. Todo lo que necesitas es sólo una conexión a Internet.
Base de datos NoSQL
Una base de datos NoSQL es un enfoque para diseñar bases de datos que puedan acomodar una amplia variedad de modelos de datos. NoSQL significa 'no sólo SQL'. Es una alternativa a las bases de datos relacionales tradicionales en las que los datos se colocan en tablas y el esquema de datos está perfectamente diseñado antes de crear la base de datos.
Las bases de datos NoSQL son útiles para un gran conjunto de datos distribuidos.
Algunos ejemplos de sistema de base de datos NoSQL con su categoría son:
- MongoDB, CouchDB, Cloudant (basado en documentos)
- Memcached, Redis, coherencia (almacenamiento clave-valor)
- HBase, Mesa Grande, Acumulación (Tabular)
Ventaja de NoSQL
Alta escalabilidad
NoSQL puede manejar una gran cantidad de datos debido a su escalabilidad. Si los datos crecen, la base de datos NoSQL los escala para manejarlos de manera eficiente.
Alta disponibilidad
NoSQL admite la replicación automática. La replicación automática la hace altamente disponible porque, en caso de cualquier falla, los datos se replican al estado consistente anterior.
Desventaja de NoSQL
Fuente abierta
NoSQL es una base de datos de código abierto, por lo que todavía no existe un estándar confiable para NoSQL.
Reto de gestión
La gestión de datos en NoSQL es mucho más complicada que las bases de datos relacionales. Es muy difícil de instalar y aún más complicado de administrar a diario.
La interfaz gráfica de usuario no está disponible
Las herramientas GUI para bases de datos NoSQL no están fácilmente disponibles en el mercado.
Respaldo
La copia de seguridad es un gran punto débil para las bases de datos NoSQL. Algunas bases de datos, como MongoDB, no tienen métodos potentes para realizar copias de seguridad de datos.
Las bases de datos orientadas a objetos
Las bases de datos orientadas a objetos contienen datos en forma de objetos y clases. Los objetos son la entidad del mundo real y los tipos son la colección de objetos. Una base de datos orientada a objetos es una combinación de características del modelo relacional con principios orientados a objetos. Es una implementación alternativa a la del modelo relacional.
Las bases de datos orientadas a objetos mantienen las reglas de la programación orientada a objetos. Un sistema de gestión de bases de datos orientado a objetos es una aplicación híbrida.
El modelo de base de datos orientada a objetos contiene las siguientes propiedades.
Propiedades de programación orientada a objetos
- Objetos
- Clases
- Herencia
- Polimorfismo
- Encapsulación
Propiedades de bases de datos relacionales
- Atomicidad
- Consistencia
- Integridad
- Durabilidad
- concurrencia
- Procesamiento de consultas
Bases de datos de gráficos
Una base de datos de gráficos es una base de datos NoSQL. Es una representación gráfica de datos. Contiene nodos y aristas. Un nodo representa una entidad y cada borde representa una relación entre dos bordes. Cada nodo en una base de datos de gráficos representa un identificador único.
Las bases de datos de gráficos son beneficiosas para buscar la relación entre datos porque resaltan la relación entre datos relevantes.
Las bases de datos de gráficos son muy útiles cuando la base de datos contiene una relación compleja y un esquema dinámico.
topología de las estrellas
Se utiliza principalmente en gestión de la cadena de suministro , identificando la fuente de Telefonía IP .
DBMS (Sistema de gestión de bases de datos)
El sistema de gestión de bases de datos es un software que se utiliza para almacenar y recuperar la base de datos. Por ejemplo, Oracle, MySQL, etc.; Estas son algunas herramientas DBMS populares.
- DBMS proporciona la interfaz para realizar diversas operaciones como creación, eliminación, modificación, etc.
- DBMS permite al usuario crear sus bases de datos según sus necesidades.
- DBMS acepta la solicitud de la aplicación y proporciona datos específicos a través del sistema operativo.
- DBMS contiene el grupo de programas que actúa de acuerdo con las instrucciones del usuario.
- Proporciona seguridad a la base de datos.
Ventaja del DBMS
Controla la redundancia
Almacena todos los datos en un único archivo de base de datos, por lo que puede controlar la redundancia de datos.
Compartir datos
Un usuario autorizado puede compartir los datos entre varios usuarios.
Respaldo
Proporciona un subsistema de respaldo y recuperación. Este sistema de recuperación crea datos automáticos a partir de fallas del sistema y los restaura si es necesario.
Múltiples interfaces de usuario
Proporciona un tipo diferente de interfaces de usuario como GUI e interfaces de aplicaciones.
Desventaja del DBMS
Tamaño
Ocupa gran espacio en disco y gran memoria para funcionar de manera eficiente.
Costo
DBMS requiere un procesador de datos de alta velocidad y mayor memoria para ejecutar el software DBMS, por lo que es costoso.
Complejidad
DBMS crea complejidad y requisitos adicionales.
RDBMS (Sistema de gestión de bases de datos relacionales)
La palabra RDBMS se denomina 'Sistema de gestión de bases de datos relacionales'. Se representa como una tabla que contiene filas y columnas.
RDBMS se basa en el modelo relacional; fue introducido por E. F. Codd.
Una base de datos relacional contiene los siguientes componentes:
- Mesa
- Registro/tupla
- Nombre de campo/columna/atributo
- Instancia
- Esquema
- Llaves
Un RDBMS es un DBMS tabular que mantiene la seguridad, integridad, precisión y coherencia de los datos.