En el modelo de bases de datos relacionales, se recurre a las sentencias JOIN de SQL para consultar diferentes tablas de bases de datos. A excepción de CROSS JOIN, las sentencias de JOIN son una combinación de producto cartesiano y selección.
El Sistema Gestor de Bases de Datos (SGBD) primero presenta el producto cartesiano de dos tablas de bases de datos. A continuación, filtra el resultado según una condición de selección definida por el usuario a través de una sentencia SQL. El INNER JOIN se diferencia de todas las demás sentencias de JOIN por mostrar un conjunto de resultados mínimos, pues solo se muestran los registros de datos del producto cruzado que cumplen la condición de selección. Todo ello se presenta en una tabla de resultados llamada “View” que no incluye valores nulos.
Nosotros podemos consultar el contenido de una tabla muy puntualmente:
SELECT * FROM myTable
Sin embargo, generalmente necesitamos combinar información de distintas tablas.
Obtener datos específicos de distintas tablas, y presentar la información de una mejor manera, resulta de ayuda para la toma de decisiones.
Cuando trabajamos con bases de datos relacionales:
- Una tabla fuerte representa una entidad independiente, y una tabla débil representa una entidad que depende de otra.
- Estas relaciones (dependencias entre tablas) consisten en columnas que tienen un mismo tipo de dato.
Entonces, la cláusula JOIN nos permite asociar 2 o más tablas, en base a una columna que tengan en común.
Ejemplo: Empleados y Departamentos
A continuación vamos a analizar la cláusula JOIN y sus variantes.
Pero primero, empecemos definiendo 2 tablas, que serán la base para nuestros ejemplos posteriores.
Por un lado vamos a tener una tabla Empleados
(que almacenará una lista de empleados y el id del departamento al que pertenecen):
Nombre | DepartamentoId |
---|---|
Rafferty | 31 |
Jones | 33 |
Heisenberg | 33 |
Robinson | 34 |
Smith | 34 |
Williams | NULL |
Y por otro lado, una tabla Departamentos
(con la lista de departamentos que existen en la empresa).
Id | Nombre |
---|---|
31 | Sales |
33 | Engineering |
34 | Clerical |
35 | Marketing |
Entonces, si quieres seguir el tutorial, puedes ejecutar el siguiente script SQL para dar origen a las tablas y sus datos correspondientes:
CREATE DATABASE TestJoin
GO
USE TestJoin
GO
CREATE TABLE Departamentos
(
Id int,
Nombre varchar(20)
);
CREATE TABLE Empleados
(
Nombre varchar(20),
DepartamentoId int
);
INSERT INTO Departamentos VALUES(31, 'Sales');
INSERT INTO Departamentos VALUES(33, 'Engineering');
INSERT INTO Departamentos VALUES(34, 'Clerical');
INSERT INTO Departamentos VALUES(35, 'Marketing');
INSERT INTO Empleados VALUES('Rafferty', 31);
INSERT INTO Empleados VALUES('Jones', 33);
INSERT INTO Empleados VALUES('Heisenberg', 33);
INSERT INTO Empleados VALUES('Robinson', 34);
INSERT INTO Empleados VALUES('Smith', 34);
INSERT INTO Empleados VALUES('Williams', NULL);
En este script SQL
, creamos una base de datos llamada TestJoin
, y dentro de ella las 2 tablas mencionadas.
Ten en cuenta que podrías usar otro nombre para la base de datos, si así lo prefieres.
Hasta este punto, puedes confirmar que todo haya salido bien, consultando las 2 tablas correspondientes:
SELECT * FROM Empleados;
SELECT * FROM Departamentos;
Cláusula INNER JOIN
Lo más usual, lo primero que se suele aprender, es el uso de INNER JOIN
, o generalmente abreviado como JOIN
.
Esta cláusula busca coincidencias entre 2 tablas, en función a una columna que tienen en común. De tal modo que sólo la intersección se mostrará en los resultados.
Por ejemplo, si queremos listar a los empleados e indicar el nombre del departamento al que pertenecen, podemos hacer lo siguiente:
SELECT *
FROM Empleados E
JOIN Departamentos D
ON E.DepartamentoId = D.Id
Con esto, nuestro resultado será:
Nombre | DepartmentoId | Id | Nombre |
---|---|---|---|
Rafferty | 31 | 31 | Sales |
Jones | 33 | 33 | Engineering |
Heisenberg | 33 | 33 | Engineering |
Robinson | 34 | 34 | Clerical |
Smith | 34 | 34 | Clerical |
Y apartir de aquí podemos notar lo siguiente:
- El empleado «Williams» no aparece en los resultados, ya que no pertenece a ningún departamento existente.
- El departamento «Marketing» tampoco aparece, ya que ningún empleado pertenece a dicho departamento.
¿Por qué ocurre esto? Porque JOIN
muestra como resultado la intersección de ambas tablas.
También hay que tener en cuenta que, en los resultados vemos 4 columnas. Las 2 primeras se corresponden con la tabla Empleados
y las últimas con Departamentos
.
Esto ocurre porque estamos seleccionando todas las columnas con un *
.
Si queremos, podemos ser específicos y seleccionar sólo 2 columnas (además de asignarles un alias):
SELECT
E.Nombre as 'Empleado',
D.Nombre as 'Departamento'
FROM Empleados E
JOIN Departamentos D
ON E.DepartamentoId = D.Id
Y así obtener:
Empleado | Departamento |
---|---|
Rafferty | Sales |
Jones | Engineering |
Heisenberg | Engineering |
Robinson | Clerical |
Smith | Clerical |
Cláusula LEFT JOIN
A diferencia de un INNER JOIN
, donde se busca una intersección respetada por ambas tablas, con LEFT JOIN
damos prioridad a la tabla de la izquierda, y buscamos en la tabla derecha.
Si no existe ninguna coincidencia para alguna de las filas de la tabla de la izquierda, de igual forma todos los resultados de la primera tabla se muestran.
He aquí una consulta de ejemplo:
SELECT
E.Nombre as 'Empleado',
D.Nombre as 'Departamento'
FROM Empleados E
LEFT JOIN Departamentos D
ON E.DepartamentoId = D.Id
- La tabla
Empleados
es la primera tabla en aparecer en la consulta (en elFROM
), por lo tanto ésta es la tablaLEFT
(izquierda), y todas sus filas se mostrarán en los resultados. - La tabla
Departamentos
es la tabla de la derecha (aparece luego delLEFT JOIN
). Por lo tanto, si se encuentran coincidencias, se mostrarán los valores correspondientes, pero sino, apareceráNULL
en los resultados.
Empleado | Departamento |
---|---|
Rafferty | Sales |
Jones | Engineering |
Heisenberg | Engineering |
Robinson | Clerical |
Smith | Clerical |
Williams | NULL |
Cláusula RIGHT JOIN
En el caso de RIGHT JOIN
la situación es muy similar, pero aquí se da prioridad a la tabla de la derecha.
De tal modo que si usamos la siguiente consulta, estaremos mostrando todas las filas de la tabla de la derecha:
SELECT
E.Nombre as 'Empleado',
D.Nombre as 'Departamento'
FROM Empleados E
RIGHT JOIN Departamentos D
ON E.DepartamentoId = D.Id
La tabla de la izquierda es Empleados
, mientras que Departamentos
es la tabla de la derecha.
La tabla asociada al FROM
será siempre la tabla LEFT
, y la tabla que viene después del JOIN
será la tabla RIGHT
.
Entonces el resultado mostrará todos los departamentos al menos 1 vez.
Y si no hay ningún empleado trabajando en un departamento determinado, se mostrará NULL. Pero el departamento aparecerá de igual forma.
Empleado | Departamento |
---|---|
Rafferty | Sales |
Jones | Engineering |
Heisenberg | Engineering |
Robinson | Clerical |
Smith | Clerical |
NULL | Marketing |
Cláusula FULL JOIN
Mientras que LEFT JOIN
muestra todas las filas de la tabla izquierda, y RIGHT JOIN
muestra todas las correspondientes a la tabla derecha, FULL OUTER JOIN
(o simplemente FULL JOIN
) se encarga de mostrar todas las filas de ambas tablas, sin importar que no existan coincidencias (usará NULL
como un valor por defecto para dichos casos).
Para nuestro ejemplo, ocurre lo siguiente:
SELECT
E.Nombre as 'Empleado',
D.Nombre as 'Departamento'
FROM Empleados E
FULL JOIN Departamentos D
ON E.DepartamentoId = D.Id
Se muestra el empleado «Williams» a pesasr que no está asignado a ningún departamento, y se muestra el departamento de «Marketing» a pesar que aún nadie está trabajando allí:
Empleado | Departamento |
---|---|
Rafferty | Sales |
Jones | Engineering |
Heisenberg | Engineering |
Robinson | Clerical |
Smith | Clerical |
Williams | NULL |
NULL | Marketing |
Más variantes
Si prestamos atención a los diagramas de Venn, vamos a notar que es posible formar incluso más combinaciones, al momento de seleccionar datos.
Por ejemplo, tenemos el siguiente caso, conocido como Left Excluding JOIN
:
Y de igual manera Right Excluding JOIN
:
Estas combinaciones son posibles de lograr si añadimos algunas condiciones a nuestras consultas, haciendo uso de la cláusula WHERE
.
Por ejemplo, siguiendo el ejemplo que estamos viendo (donde Empleados
es la tabla izquierda y Departamentos
la tabla derecha):
Left Excluding JOIN
nos permitirá obtener la lista de empleados que aún no han sido asignados a ningún departamento de trabajo.- Mientras que
Right Excluding JOIN
nos mostrará la lista de departamentos que no tienen a ningún trabajador asociado.