Upgrade to Pro — share decks privately, control downloads, hide ads and more …

MODELO RELACIONAL Y LA NORMALIZACIÓN EN EL DISE...

nimri
November 09, 2024
2

MODELO RELACIONAL Y LA NORMALIZACIÓN EN EL DISEÑO DE BASES DE DATOS

MODELO RELACIONAL Y LA NORMALIZACIÓN EN EL DISEÑO DE BASES
DE DATOS

nimri

November 09, 2024
Tweet

Transcript

  1. 1 FACULTAD DE CIENCIAS E INGENIERÍA CARRERA DE INGENIERÍA DE

    TECNOLOGÍAS DE LA INFORMACIÓN TEMA: MODELO RELACIONAL Y LA NORMALIZACIÓN EN EL DISEÑO DE BASES DE DATOS AUTORES: ASTUDILLO HOLGUIN LUIS RICARDO CHIQUITO FLORES YANDRY STEVEN CONSTANTINE COBEÑA NEREXI DAMARIS MORA OTAVALO MAYBETH ALEXANDRA SEGOVIA TAMAYO EDGAR FERNANDO VARGAS SUAREZ KLEVER IVAN ASIGNATURA: SISTEMAS DE BASE DE DATOS DOCENTE: Ing. MARÍA GABRIELA ESPINOZA BRAVO FECHA DE ENTREGA: 12 DE OCTUBRE DEL 2024 PERIODO: Septiembre 2024 a Octubre 2024 MILAGRO – ECUADOR
  2. 2 ÍNDICE OBJETIVO……………………………………………………………………. 3 INTRODUCCIÓN……………………………………………………………... 3 DESARROLLO MODELO RELACIONAL DEFINICIÓN,

    CARACTERÍSTICAS………………………………………… 4 ELEMENTOS FUNDAMENTALES…………………………………………. 4,5 VENTAJAS Y DESVENTAJAS……………………………………………… 5,6 NORMALIZACIÓN EN LA GESTIÓN DE BASE DE DATOS DEFINICIÓN Y OBJETIVO………………………………………………….. 7 EXPLICACIÓN DE LAS FORMAS NORMALES…………………………..7,8,9,10,11 ANÁLISIS DE LOS PROBLEMAS QUE RESUELVE LA NORMALIZACIÓN..12,13 DISCUSIÓN SOBRE LAS LIMITACIONES…………………………………. 13,14 CONCLUSIÓN…………………………………………………………………. 14 RECOMENDACIONES……………………………………………………….. 15,16 BIBLIOGRAFÍA……………………………………………………………….. 16,17
  3. 3 OBJETIVO Comprender y analizar el modelo relacional y la

    normalización los cuales son herramientas esenciales para el diseño de bases de datos de alta calidad. Al seguir estos principios, los desarrolladores pueden crear bases de datos que sean fiables, eficientes y fáciles de mantener a largo plazo. INTRODUCCIÓN Imaginemos una biblioteca. Los libros están organizados en estanterías, cada una con diferentes categorías (ficción, no ficción, etc.). Cada libro tiene un título único, un autor y una fecha de publicación. Esta organización permite encontrar fácilmente cualquier libro y mantener la información actualizada, con esto podemos decir lo siguiente: El modelo relacional es como esa biblioteca, pero para datos en una computadora. En lugar de libros y estanterías, tenemos tablas y registros. Una tabla es como una estantería, y cada registro es como un libro, con información específica en cada columna (título, autor, etc.). La normalización es un conjunto de reglas que nos ayudan a organizar estas tablas de la manera más eficiente y sin redundancias. Es como ordenar los libros en la biblioteca de forma que sea fácil encontrarlos y evitar duplicados. Por lo que, el modelo relacional y la normalización son fundamentales para diseñar bases de datos eficientes y fiables. Al comprender estos conceptos, podrás crear bases de datos que soporten tus aplicaciones de manera óptima. En el siguiente trabajo está presente la investigación, en la cual, se habla más a cerca del modelo relacional y la normalización, analizando y tratando puntos importantes a cerca de estos temas, se espera una buena comprensión lectora.
  4. 4 MODELO RELACIONAL El modelo relacional es un paradigma de

    gestión de datos que organiza la información en tablas. Estas tablas están relacionadas entre sí a través de campos comunes, lo que permite establecer vínculos y dependencias entre los datos. Este modelo, introducido por E.F. Codd en la década de 1970, se ha convertido en el estándar de facto para el diseño de bases de datos debido a su simplicidad, flexibilidad y capacidad para gestionar grandes volúmenes de información. Características Simplicidad: El modelo relacional se basa en conceptos matemáticos sencillos, como conjuntos y relaciones, lo que facilita su comprensión y aplicación. Flexibilidad: Permite representar una amplia variedad de datos y relaciones entre ellos, adaptándose a diferentes tipos de aplicaciones. Integridad: Garantiza la consistencia y precisión de los datos a través de mecanismos como las claves primarias y foráneas. Eficiencia: Los sistemas de gestión de bases de datos relacionales (SGBDR) ofrecen herramientas para optimizar el acceso y la manipulación de los datos. Elementos Fundamentales Tablas: Estructura: Las tablas están organizadas en filas (registros) y columnas (atributos). Contenido: Cada fila representa una instancia de una entidad (por ejemplo, un cliente, un producto). Atributos: Las columnas definen las propiedades de cada entidad (por ejemplo, nombre, dirección, precio). Relaciones: Vínculos: Las relaciones establecen conexiones entre las tablas. Clave foránea: Un atributo en una tabla que hace referencia a la clave primaria de otra tabla.
  5. 5 Cardinalidad: Define el número de registros que pueden estar

    relacionados en ambas tablas (uno a uno, uno a muchos, muchos a muchos). Clave Primaria: Identificador único: Un atributo o conjunto de atributos que identifica de forma única cada registro en una tabla. No nulo: Nunca puede tener un valor nulo. Único: No puede repetirse en la tabla. Clave Foránea: Referencia: Un atributo en una tabla que hace referencia a la clave primaria de otra tabla. Integridad referencial: Garantiza que los valores de la clave foránea existan en la tabla referenciada. Ejemplo Consideremos una base de datos para una tienda en línea: Tabla Clientes: (id_cliente, nombre, dirección, teléfono) Tabla Productos: (id_producto, nombre, precio, stock) Tabla Pedidos: (id_pedido, id_cliente, id_producto, cantidad) ejemplo: id_cliente es la clave primaria de la tabla Clientes. id_producto es la clave primaria de la tabla Productos. id_cliente e id_producto son claves foráneas en la tabla Pedidos, estableciendo una relación entre los clientes, los productos y los pedidos. Ventajas del Modelo Relacional Facilidad de uso: El lenguaje SQL (Structured Query Language) proporciona una forma sencilla de interactuar con las bases de datos relacionales. Flexibilidad: Permite modelar una amplia variedad de aplicaciones.
  6. 6 Escalabilidad: Los SGBDR pueden gestionar grandes volúmenes de datos.

    Madurez: El modelo relacional es una tecnología madura y ampliamente utilizada. https://bookdown.org/paranedagarcia/database/images/db-relacionterminos.jpg Desventajas del Modelo Relacional A pesar de su amplia adopción y sus numerosas ventajas, el modelo relacional presenta algunas limitaciones que es importante considerar al diseñar una base de datos: Rendimiento en grandes volúmenes de datos: Al realizar consultas que involucran múltiples tablas y uniones, el rendimiento puede degradarse significativamente, especialmente en bases de datos muy grandes. Escalabilidad: A medida que el volumen de datos crece, puede ser difícil mantener un rendimiento óptimo, ya que las operaciones de lectura y escritura se vuelven más lentas. Dificultad para modelar datos no estructurados: El modelo relacional está diseñado principalmente para almacenar datos estructurados en tablas, lo que dificulta el manejo de datos no estructurados como texto, imágenes, videos o documentos. Esquemas rígidos: Los esquemas de las bases de datos relacionales suelen ser rígidos, lo que puede limitar la flexibilidad al agregar nuevos tipos de datos. Costos de implementación y mantenimiento: Hardware: Los SGBDR relacionales suelen requerir hardware potente para gestionar grandes volúmenes de datos y realizar consultas complejas. Software: Las licencias de los SGBDR comerciales pueden ser costosas. Personal especializado: Se necesita personal cualificado para diseñar, implementar y mantener bases de datos relacionales.
  7. 7 Anomalías de actualización, Inconsistencias: Si no se siguen las

    reglas de normalización, pueden surgir inconsistencias en los datos al modificar registros. Duplicación de datos: La duplicación de datos puede llevar a ineficiencias y a la propagación de errores. Implementación de ciertas consultas complejas: Algunas consultas, como las que involucran jerarquías o datos geográficos, pueden ser difíciles de expresar en SQL y requerir un rendimiento subóptimo. Esquemas rígidos, adaptabilidad: Modificar el esquema de una base de datos relacional puede ser complejo y requerir tiempo, lo que dificulta adaptarse a los cambios en los requisitos del negocio. NORMALIZACIÓN EN LA GESTIÓN DE BASE DE DATOS La normalización es un proceso fundamental en el diseño de bases de datos que busca minimizar la redundancia y garantizar la integridad de los datos. Este trabajo de investigación se enfoca en explicar las formas normales (1FN, 2FN, 3FN, BCNF, etc.) proporcionaremos ejemplos prácticos de cómo aplicar cada una. Además, vamos analizar cómo la normalización aborda problemas como la redundancia y las anomalías de inserción, actualización y eliminación. Formas Normales Primera Forma Normal (1FN) Se asegura que cada columna contenga valores atómicos y que cada fila sea única. Una tabla está en 1FN si es que los atributos contienen valores atómicos (es decir no se pueden dividir ni descomponer en partes más pequeñas) y no contiene grupos repetitivos. Cada fila debe ser única y con contener una lista o conjunto de valores. Ejemplo: Supongamos que tenemos una tabla Estudiante que almacena la información de los cursos de los estudiantes. ID_Estudiante Nombre Cursos 1 Klever Matemáticas, Historia 2 Alexandra Química
  8. 8 3 Fernando Matemáticas, Química Problema: La columna Cursos no

    está en 1FN porque contiene valores no atómicos. Para solucionar este problema debemos separar los cursos en filas individuales. ID_Estudiante Nombre Curso 1 Klever Matemáticas 1 Klever Historia 2 Alexandra Química 3 Fernando Matemáticas 3 Fernando Química Segunda Forma Normal (2FN) Una tabla está en 2FN si cumple con 1FN y todos los atributos no clave dependen completamente de la clave primaria. Esto significa que todos los datos que no forman parte de la clave principal deben depender de toda la clave principal y no solo de una parte de ella. Ejemplo: Considerando el ejemplo de la tabla anterior, supongamos que además tenemos un campo Profesor que depende solo del Curso. ID_Estudiante Nombre Curso Profesor 1 Klever Matemáticas Ing. Pérez 1 Klever Historia Ing. López 2 Alexandra Química Ing. Romero 3 Fernando Matemáticas Ing. Pérez 3 Fernando Química Ing. Romero Problema: La tabla no está en 2FN porque Profesor depende de Curso, no de la clave primaria (ID_Estudiante, Curso).
  9. 9 Para solucionar este problema vamos a crear una tabla

    separada para Curso y Profesor. Tabla Estudiante: ID_Estudiante Nombre 1 Klever 2 Alexandra 3 Fernando Tabla Curso: Curso Profesor Matemáticas Ing. Pérez Historia Ing. López Química Ing. Romero Tabla Estudiante_Curso: ID_Estudiante Curso 1 Matemáticas 1 Historia 2 Química 3 Matemáticas 3 Química Tercera Forma Normal (3FN) Una tabla está en 3FN si cumple con 2FN y no tiene dependencias transitivas; los atributos no clave no deben depender de otros atributos no clave. Esto implica que todos los atributos no clave deben depender de la clave primaria completa. En otras palabras, no puede haber atributos que dependan solo de una parte de la clave primaria. Una dependencia transitiva ocurre cuando un atributo no clave depende de otro atributo no clave, y este último depende de la clave primaria. En 3FN, se exige que todos
  10. 10 los atributos no clave dependan directamente de la clave

    primaria y no indirectamente a través de otros atributos no clave. Ejemplo: Supongamos que en la tabla Estudiante tenemos un campo Facultad que depende de Curso. ID_Estudiante Nombre Curso Facultad 1 Klever Matemáticas Ciencias 2 Alexandra Química Ciencias 3 Fernando Historia Humanidades Problema: Facultad depende de Curso, no de ID_Estudiante. Para solucionar este problema vamos a crear una tabla separada para Curso y `Facultad. Resultado final: Tabla estudiante contiene información única sobre cada estudiante. (Sin cambios). ID_Estudiante Nombre 1 Klever 2 Alexandra 3 Fernando Tabla curso contiene información única sobre cada curso y el profesor correspondiente (sin cambios). Curso Profesor Matemáticas Ing. Pérez Historia Ing. López Química Ing. Romero Tabla facultad relaciona cada curso con su respectiva facultad. Curso Facultad
  11. 11 Matemáticas Ciencias Química Ciencias Historia Humanidades Forma Normal de

    Boyce-Codd (BCNF) Una tabla está en BCNF si es en 3FN y, para cada dependencia funcional, la determinante es una superclave, esto quiere decir que una tabla está en BCNF cuando no solo cumple con las reglas de la 3FN, sino que además asegura que cualquier dependencia funcional en la tabla se base en una clave completa o en una superclave. Una tabla está en BCNF si cumple dos condiciones: Debe estar en Tercera Forma Normal (3FN): Esto significa que todos los atributos no clave deben depender de la clave primaria completa y no deben existir dependencias transitivas. Para cada dependencia funcional, el determinante debe ser una superclave: Una superclave es cualquier conjunto de atributos que puede identificar de forma única una tupla (fila) en una tabla. En otras palabras, si un conjunto de atributos determina otro atributo, ese conjunto de atributos debe ser capaz de identificar de forma única cada fila de la tabla. Ejemplo: Supongamos que tenemos una tabla Clase con la siguiente información: Curso Profesor Aula Matemáticas Ing. Pérez A101 Química Ing. López A102 Matemáticas Ing. Romero A101 Problema: En este caso, Aula no depende completamente de Curso y Profesor. La solución es crear una tabla separada para Aula. Tabla Clase: Curso Profesor
  12. 12 Matemáticas Ing. Pérez Historia Ing. López Química Ing. Romero

    Tabla Aula: Curso Aula Matemáticas A101 Química A102 Análisis de los problemas que resuelve la normalización (redundancia, anomalías de inserción, actualización y eliminación). La normalización es una técnica fundamental en el diseño de bases de datos relacionales que busca organizar los datos de manera lógica y eficiente, minimizando redundancias e inconsistencias. Al aplicar las formas normales, se resuelven una serie de problemas comunes asociados con el almacenamiento y manipulación de datos. Redundancia de Datos La redundancia se da cuando la misma información es almacenada en varios o multiples lugares. Esto puede resultar en un uso ineficiente del espacio y inconsistencias en los datos. Ejemplo: Sin normalización, el nombre de un profesor podría aparecer múltiples veces en diferentes registros de estudiantes, lo que lleva a duplicación de información. Anomalías de Inserción Las anomalías de inserción ocurren cuando es imposible insertar datos en una tabla debido a dependencias no deseadas. Ejemplo: Si un nuevo curso se ofrece, pero no hay estudiantes inscritos, no se podría agregar el curso a la tabla sin ingresar un estudiante también, lo que es incorrecto. Anomalías de Actualización Las anomalías de actualización surgen cuando se necesita actualizar datos en varios lugares. Si no se actualizan todos los registros, se pueden producir inconsistencias.
  13. 13 Ejemplo: Si el nombre de un profesor cambia y

    hay múltiples registros con su nombre en diferentes filas, algunos registros podrían quedar desactualizados. Anomalías de Eliminación Las anomalías de eliminación ocurren cuando la eliminación de un registro provoca la pérdida de información importante. Ejemplo: Si se elimina el último estudiante que tomó un curso, se perdería la información sobre ese curso. Discusión sobre las limitaciones de la normalización y el concepto de desnormalización En particular, la normalización se puede aplicar tanto a la frecuencia de muestreo como a la capacidad del canal, de acuerdo con los principios establecidos por los teoremas de Nyquist y Shannon. Normalización de la Frecuencia de Muestreo: Según el Teorema de Nyquist, la frecuencia de muestreo mínima debe ser al menos el doble de la frecuencia máxima de la señal a digitalizar. Esto garantiza que la señal pueda ser reconstruida fielmente después de la transmisión, sin pérdida de información. Por ejemplo, si una señal tiene una frecuencia máxima de 10 kHz, la frecuencia de muestreo normalizada debe establecerse en al menos 20 kHz. 𝐹𝑚𝑢𝑒𝑠𝑡𝑟𝑒𝑜 = 2 × 𝐹𝑚𝑎𝑥 Donde 𝐹𝑚𝑢𝑒𝑠𝑡𝑟𝑒𝑜 es la frecuencia de muestreo normalizada y 𝐹𝑚𝑎𝑥 es la frecuencia máxima de la señal. Normalización de la Capacidad del Canal: El Teorema de Shannon indica que la capacidad máxima de un canal de transmisión depende de su ancho de banda y de la relación señal-ruido (SNR). La fórmula utilizada para calcular esta capacidad es: C = B × 𝑙𝑜𝑔2 (1 + SNR) Donde C es la capacidad del canal en bits por segundo, B es el ancho de banda en Hz y SNR es la relación señal-ruido convertida de decibeles (dB) a una proporción.
  14. 14 Para normalizar la capacidad del canal, es crucial asegurar

    que el SNR esté correctamente convertido y que el ancho de banda se mantenga dentro de los límites permitidos, garantizando así una transmisión libre de interferencias y distorsiones. CONCLUSIÓN En esta práctica, hemos aplicado los teoremas de Nyquist y Shannon para abordar problemáticas centrales en la comunicación de datos digitales. Este ejercicio nos ha permitido reconocer la importancia de la tasa de muestreo mínima para asegurar una adecuada digitalización de las señales y evitar la pérdida de información. Además, el cálculo de la capacidad máxima del canal, en función de la SNR y el ancho de banda, ilustra cómo estos parámetros afectan la eficiencia y la velocidad en la transmisión de datos. Los resultados obtenidos son consistentes con las expectativas teóricas, y el programa desarrollado automatiza estos procesos, proporcionando resultados rápidos y precisos. La normalización es un pilar fundamental en el diseño de bases de datos relacionales. Al aplicar las formas normales, se garantiza una estructura lógica y eficiente que minimiza redundancias, inconsistencias y anomalías, lo que a su vez se traduce en una serie de beneficios significativos: Integridad de los datos: Al eliminar redundancias y garantizar que cada dato se almacene una sola vez, se reduce el riesgo de inconsistencias y errores. Flexibilidad: Una base de datos normalizada es más fácil de modificar y ampliar para adaptarse a nuevos requisitos. Eficiencia: Las consultas se ejecutan más rápido y de manera más eficiente, ya que se reducen las operaciones de búsqueda y acceso a datos repetidos. Mantenimiento simplificado: Una estructura clara y organizada facilita las tareas de mantenimiento y actualización de la base de datos. Escalabilidad: Las bases de datos normalizadas pueden crecer y adaptarse a mayores volúmenes de datos de manera más eficiente. la normalización no es solo una técnica, sino una inversión a largo plazo que garantiza la calidad, la fiabilidad y la sostenibilidad de una base de datos.
  15. 15 Recomendaciones y Buenas Prácticas para Implementar Bases de Datos

    Relacionales Efectivas Además de aplicar las formas normales, se recomiendan las siguientes prácticas para implementar bases de datos relacionales efectivas: Fase de Diseño Análisis detallado de los requisitos: Comprender a fondo las necesidades del negocio y los datos que se van a almacenar es crucial para un diseño adecuado. Identificación de entidades y relaciones: Definir claramente las entidades (tablas) y las relaciones entre ellas. Además de elegir una clave primaria adecuada que identifique de forma única cada registro. Normalización exhaustiva y documentación detallada: Aplicar las formas normales de manera rigurosa para garantizar una estructura óptima. Crear una documentación completa del diseño de la base de datos, incluyendo diagramas entidad- relación (ER) y descripciones de las tablas y relaciones. Fase de Implementación Uso de un SGBDR adecuado: Seleccionar un sistema de gestión de bases de datos relacional (SGBDR) que se adapte a las necesidades del proyecto y ofrezca las características necesarias. Creación de índices, optimización y control de acceso: Crear índices en los campos que se utilizan con frecuencia en las consultas para mejorar el rendimiento. Escribir consultas SQL eficientes para evitar bloqueos y mejorar el rendimiento. Y también, implementar mecanismos de seguridad para proteger los datos y controlar el acceso a la base de datos. Fase de Mantenimiento Monitoreo del rendimiento: Realizar un seguimiento del rendimiento de la base de datos y ajustar la configuración si es necesario. Realización de copias de seguridad: Crear copias de seguridad periódicas para proteger los datos ante posibles pérdidas.
  16. 16 Mantenimiento de la estructura: Mantener actualizada la estructura de

    la base de datos para adaptarse a los cambios en los requisitos del negocio. La implementación de bases de datos relacionales efectivas requiere una combinación de conocimientos técnicos, buenas prácticas y una comprensión profunda de los requisitos del negocio. Al seguir estas recomendaciones, se pueden crear bases de datos sólidas, escalables y fáciles de mantener. BIBLIOGRAFÍA Araneda, P. (2021, 31 marzo). Capítulo 7 El modelo relacional | Base de datos. https://bookdown.org/paranedagarcia/database/el-modelo-relacional.htm Castañeda, M. P. (s. f.). Normalización de bases de datos. https://programas.cuaed.unam.mx/repositorio/moodle/pluginfile.php/872/mod_re source/content/7/Contenido/index.html Connolly, T. M., & Begg, C. (2015). Database Systems: A Practical Approach to Design, Implementation, and Management. Pearson. Connolly, T. M., & Begg, C. E. (2015). Database Systems: A Practical Approach to Design, Implementation, and Management. Pearson. D, S. (2023, 6 octubre). Teorema de Nyquist. Club de los Teoremas. https://goo.su/amWNUj6 Date, C. J. (2004). An Introduction to Database Systems. Addison-Wesley. Elmasri, R., & Navathe, S. B. (2015). Fundamentals of Database Systems. Pearson. Fernández, L. G. B. (2024, 12 febrero). Normalización de bases de datos | Lituus Analytics. Lituus Data Analytics. https://lituus.cl/Analytics/data- warehouse/normalizacion-de-bases-de-datos.htm Helenclu. (2024, 6 junio). Descripción de la normalización de la base de datos - Microsoft 365 Apps. Microsoft Learn. https://learn.microsoft.com/es- es/office/troubleshoot/access/database-normalization-description
  17. 17 Jorge Sánchez. Manual de Gestión de Bases de Datos.

    Modelo Relacional. (s. f.). https://jorgesanchez.net/manuales/gbd/modelo-relacional.html Marin, S. R., & Marin, S. R. (2023, 8 septiembre). Descubre el poder del teorema de muestreo de Nyquist-Shannon: ¡la clave para la calidad perfecta en tus muestras! https://goo.su/sUpn Rob, P., & Coronel, C. (2016). Database Systems: Design, Implementation, & Management. Cengage Learning. Silberschatz, A., Korth, H. F., & Sudarshan, S. (2011). Database System Concepts. McGraw-Hill. Superior, E. F. P. (s. f.). Normalización de bases de datos: qué es, ejemplos y por qué es importante. https://www.esic.edu/rethink/tecnologia/normalizacion-bases-de- datos-que-es-ejemplos-c Teorema de muestreo de Nyquist-Shannon _ AcademiaLab. (s. f.). https://academia-lab.com/enciclopedia/teorema-de-muestreo-de-nyquist-shannon/ Yanet, E. M. (2012, 4 abril). Sistema para la Integración del Proceso de Normalización de Bases de Datos Relacionales con Gestores de Bases de Datos (SINORGES).t. https://repositorio.uci.cu/handle/ident/4601