Estructura de bases de datos relacionales. Rafael Barzanallana. Universidad de Murcia. Informática Aplicada a la Gestión Pública

Estructura de las Bases de Datos Relacionales
Rev. 1.0a 2002/12/29
Asignatura Informática Aplicada a la Gestión Pública

1.- Estructura de las Bases de Datos Relacionales

Es la estructura más utilizada actualmente. En ella los datos están estructurados en tablas:

- Cada fila es un registro o entidad.

- Cada columna es un campo de ese registro.

Esta estructura es similar al concepto matemático de relación, por ello ha tenido tanto auge, ya que todas las teorías y reglas matemáticas sobre relaciones son aplicables, lo que hace que sea fácil de formalizar.

A la tabla se le llama relación, y a cada fila tupla; a cada columna de una tupla se le llamará atributo, es en esto en lo que se diferencia del modelo matemático.

Convencionalismos

Los nombres de relaciones siempre en minúsculas.
Cada tupla se puede representar por una variable de tupla.
Cada atributo se representa por su nombre.
Cardinalidad = Nº de tuplas de una relación.
Grado = Nº de atributos de la relación.
Cada atributo puede tomar valores dentro de su dominio de atributo (Conjunto de valores posibles)
El esquema de una relación se representa en letras mayúsculas: r(R) donde r sería el nombre de la relación y R el nombre del esquema.
Formato de un esquema: Nom_esquema=(lista de atributos con sus dominios).

Ejemplo: Alumnos = (dni: dom_dni; nombre: dom_nombre; edad: dom_edad). Obsérvese que la primera letra de Alumnos es mayúscula (es un esquema).

Esquema = Definición global y general de una relación.
Instancia de una relación = Información que contiene una relación en un momento determinado.

2.- Propiedades de las Relaciones

Miden su grado de bondad /aproximación al modelo real matemático por una serie de "formas normales", según se sube en las formas se dice que la relación está mejor diseñada. Al menos debe estar en la primera forma normal (1NF) y para ello debe cumplir:

No hay duplicación de tuplas.

No hay orden entre las tuplas.

No hay orden entre los atributos (se accede a través de su nombre).

No existen atributos que no sean atómicos (una casilla un dato). Es decir, no existe la posibilidad de tener una tabla como la siguiente:

Alumno	Asignatura
José	Cálculo
	Algebra
	Física

Sin embargo si es correcta esta otra:

Alumno	Asignatura
José	Cálculo
José	Algebra
José	Física

Por último, decir que existe la posibilidad de relacionar relaciones entre sí a través de atributos comunes, esto evita la duplicación de la información. Dividimos un esquema en más de uno.
Ejemplo: Alumno = (nombre: dom_nombre; nº: entero)
Asignatura = (nº: entero; asignatura:dom_asignatura).

En este caso el campo común entre las relaciones es el campo nº:

Nombre	Núm.
José	15
Antonio	17
Pedro	18

Num.	Asignatura
15	Cálculo
15	Algebra
15	Física

3.- Claves en el Modelo Relacional.

Debe existir un atributo o conjunto de atributos que identifique de un modo único a una tupla; a ese atributo se le llamaría superclave (puede ser el conjunto formado por todos los atributos), al menos hay uno siempre.

₁

₂

₁

]

₂

]

claves candidatas

primaria

alternativas

Reglas de Integridad.

Integridad de Identidad:La clave primaria de una relación no puede contener valores nulos.

Integridad de Referencia:Cuando en una relación hay un atributo que hace referencia a una clave primaria de otra relación, el atributo debe tener un valor coincidente con alguno de la clave primaria o como mucho ser nulo (es decir, no puede tener un valor que no exista entre los valores de la clave primaria en la primera relación).

4.- Lenguajes de Consulta a Bases de Datos Relacionales

Lenguajes Formales

Lenguajes Comerciales

4.1 Lenguajes Formales.

álgebra relacional

relacional

consulta

cálculo relacional orientado a tuplas

cálculo relacional orientado a dominios

4.2 Lenguajes Comerciales

Lenguajes Formales

álgebra Relacional

A) Operaciones fundamentales:

A.1.-

Selección

_{NE =2249}

Ejemplo: s _{nombre = "Pepe" Ù edad > 25} (estudiante). De esta manera se seleccionarían todos los estudiantes llamados Pepe y cuya edad supere los 25 años.

A.2.-

Proyección

_{A1 ,..., An}

₁

Si, por ejemplo, queremos tener toda la relación de estudiantes, pero sólo con el nombre haríamos: Õ_nombre (estudiante).

Si quisiésemos obtener el nombre del estudiante 224: Õ_nombre (s _{NE = 2249}(estudiante))

A.3.-

Producto Cartesiano

₁

₂

₁

₂

₁

₂

Veamos un ejemplo: Supongamos que tenemos las siguientes relaciones:

Cliente = (nombre_cliente, ciudad, calle)

Sucursal = (nombre_sucursal, activo, ciudad)

Prestamo = (num_prestamo, nombre_sucursal, nombre_cliente, importe)

Deposito = (num_cuenta, nombre_sucursal, nombre_cliente, saldo)

Si realizamos el producto cliente x prestamo, el esquema sería la unión de los esquemas:

(cliente.nombre_cliente, ciudad, calle, num_prestamo, nombre_sucursal, prestamo.nombre_cliente, importe).

Como tuplas obtenemos las posibles combinaciones de tuplas de cliente con tuplas de prestamo.

Habrá muchas tuplas de la nueva relación en las que se cumplirá que:

t[cliente.nombre_cliente] ¹ t[prestamo.nombre_cliente] . Por ello, normalmente la operación de producto cartesiano va unida a una selección que de entre todas las posibles combinaciones de tuplas selecciona las que cumplen unas condiciones. Por ejemplo, queremos localizar los clientes y las ciudades donde viven que tengan un préstamo. Õ _{prestamo.nombre_cliente, ciudad} (s _{prestamo.nombre_cliente = cliente.nombre_cliente} (cliente x prestamo))

A.4.-

Unión de Conjuntos

₁

₂

₁

₂

₁

₂

En el ejemplo que estamos considerando, no podríamos hacer la unión de cliente con préstamo, pero sí sería posible hacer esto otro por ejemplo;

_{nombre_cliente}

Con la anterior operación obtendríamos los nombres de los clientes que tienen préstamo o no. En la práctica esta sería una operación inútil, puesto que se supone que todos los que tienen un préstamo en un banco son automáticamente clientes del banco. Veamos otra unión que sería de mayor utilidad: si queremos conocer los clientes que tienen en la sucursal 2 una cuenta, un préstamo, o ambas cosas, la operación a realizar sería:

_{nombre_cliente}

_{nombre_sucursal = "2"}

_{nombre_cliente}

_{nombre_sucursal = "2"}

A.5.-

Diferencia de Conjuntos

₁

₂

₁

₂

₁

₂

_{nombre_cliente}

_{nombre_sucursal = "Principal"}

_{nombre_cliente}

_{nombre_sucursal = "Principal"}

B) Operaciones Adicionales:

B.1.-

Intersección de Conjuntos

₁

₂

₁

₂

₁

₂

Por ejemplo, podríamos obtener los nombres de los clientes que tienen depósito y préstamo al mismo tiempo en la sucursal 10.

_{nombre_cliente}

_{nombre_sucursal = "10"}

_{nombre_cliente}

_{nombre_sucursal ="10"}

B.2.- Unión Join o Producto Theta

(P _{nombre_cliente}(s _{nombre_sucursal = "10"}(prestamo))) Q _{prestamo.nombre_cliente = deposito.nombre_cliente}(P _{nombre_cliente}(s _{nombre_sucursal = "10"} (deposito)))

P_{prestamo.nombre_cliente}(prestamo Q _{prestamo.nombre_cliente = deposito.nombre_cliente Ù}deposito) _{prestamo.nombre_sucursal = "10" Ù

deposito.nombre_sucursal = "10"}

₁

₂

₁

₂

Producto Natural

₁

₂

El siguiente ejemplo devuelve una relación con los nombres de los clientes que tienen prestamo, deposito o ambas cosas en la sucursal 10. P _{nombre_cliente}(s _{nombre_sucursal = "10"} (prestamo

deposito))

Dados r₁(R₁) y r₂(R₂) dos relaciones con sus respectivos esquemas, se cumple la siguiente igualdad: r₁

r₂ = P _{R1 È R2} (s _{r1.A1 =r2.A1 Ù .........Ù r1.An = r2.An} (r₁ x r₂))

Al ser unión de esquemas, como los elementos de los esquemas son los nombres de los atributos, si existe una columna común a R₁ y R₂ sólo aparecerá una vez.

2.- Cálculo Relacional.

A)

Cálculo Relacional Orientado a Tuplas

]

selección

]

proyecciones

]

Hasta ahora hemos usado el conectivo Ù , pero también podremos usar ú y Ø , que son el "o lógico" y el "no lógico" respectivamente. Con estos conectivos podemos realizar la unión, diferencia e intersección de conjuntos. "Queremos obtener una relación con los nombres de los clientes que o bien tienen una cuenta, o bien un préstamo, o ambas cosas en la sucursal 10" (unión).

t /

s (s

prestamo

t[nombre_cliente

]

= s[nombre_cliente

]

s[nombre_sucursal

]

= "10" )

ú $

u (u

deposito

t[nombre_cliente

]

= u[nombre_cliente

]

u[nombre_sucursal

]

= "10")

intersección

diferencia

producto cartesiano

{t / $ s (sÎ prestamo Ù t[nombre_cliente] = s[nombre_cliente] Ù s[nombre_sucursal] = "Principal" Ù $ u (uÎ cliente Ù u[nombre_cliente] = s[nombre_cliente] Ù t[ciudad] = u[ciudad] ))}

Cálculo Relacional Orientado a Dominios

_1]

₁

₂

₁

₂

₁

₂

Selección: Queremos los nombres de los clientes, número de sucursal, número de prestamo e importe de todos aquellos préstamos cuyo importe sea superior a un millón de pesetas: { < p, s, c, i > / < p, s, c, i > Î prestamo Ù i > 1.000.000 }

Proyección: Utilizaremos la cláusula $ . Por ejemplo sólo queremos los nombres de los clientes con préstamo superior a un millón.

Unión: Nombre de clientes que tengan préstamo, depósito o ambas cosas en la sucursal principal.

{ < c > / $ < p, s, c, i > Î prestamo Ù s = "Principal" V

$ < s, cu, c, sa > Î deposito Ù s = "Principal" }

Para la intersección y la diferencia, al igual que en al C.R. orientado a tupla basta sustituir el ú por un Ù o un Ù Ø respectivamente.

Apuntes actualizados en la dirección http://www.um.es/docencia/barzana/IAGP/IAGP.html

Temas relacionados:

Sistemas de bases de datos

Organización de ficheros

Página de apuntes de la asignatura Informática Aplicada a la Gestión Pública(GAP). Universidad de Murcia

Correo electrónico: barzana(arroba)um.es

www.google.es