jueves, 4 de agosto de 2016

Si de contar filas se trata

Resulta que esa página del manual de MySQL nunca la he visitado. O no le he hecho mucho caso.

En una aplicación PHP quería limitar el número de filas que devuelve una consulta pero, al mismo tiempo, saber cuántas filas obtendría sin esa limitación. Esto es

select ... limit 100

El problema es contar. Si hago la consulta dos veces, una sin límite para contar y otra limitada para mostrar el resultado, el cliente debe esperar a recibir todas las filas de la tabla y después otras 100.

Sí, para eso está el select count() ... Pero ocurre una cosa curiosa. Por la naturaleza de mi programa no puedo saber cuál es esa consulta así que lo primero que piensas es en convertirla en subconsulta:

miércoles, 6 de mayo de 2015

NULO es NULO

Hablemos del NULL, del "nulo", pero en MySQL. Cosas que si alguna vez las he sabido, se me habían olvidado.

Parece ser que la necesidad del nulo surgió del propio día a día que quería representar y gestionar el modelo relacional. Es muy habitual encontrarse con formularios donde falta algún dato, bien por ignorancia o por poca relevancia. Vamos, que casi da igual que lo pongas que no, no es importante. En otros casos incluso podría ser inaplicable, pongamos "color de pelo" si resulta que antes has elegido "piedra". Para eso es el nulo.

NULL es un, llamémosle, valor de difícil implementación. De hecho, no es un valor, es un estado, y un nulo no es igual a otro nulo. En clase solemos decir "no sabemos si tiene valor y, si tiene, no sabemos cuál es". En SQL se nota porque no se puede preguntar x = NULL. El nulo no se puede utilizar en comparaciones con "igual", "menor que" y todos los demás. Tenemos que utilizar un operador específico, x IS NULL o x IS NOT NULL.

Para liarla más autores hay que dicen que, precisamente el nulo, es el mayor error de Codd al definir el modelo relacional (1). Y Codd dice que sin los nulos no hay modelo relacional. Lo cierto es que su aplicación más clara es en las claves ajenas donde la existencia de un nulo se interpreta como ausencia de relación. Por eso la mayoría de los sistemas de gestión de bases de datos lo tratan como "ausencia de valor" o "sin valor". Esto hace las cosas más fáciles ya que el nulo solo puede trabajarse con el mencionado operador IS.

Pues bien, MySQL trata el nulo como lo que es en la teoría.

Supongamos un conjunto, típicamente un resultado de una consulta que contiene uno o varios nulos:

C1 = select a from t1

a
NULL
1
2
3



Otra consulta nos da los siguientes resultados:

C2 = select b from t2

b
 1 
1
4

Y ahora, la prueba. Queremos saber qué valores de la consulta C2 no están en el resultado de la consulta C1.

C3 = select b from t2 where b NOT IN (select a from t1)

 b 
(vacío, sin filas)

Uno espera que el resultado sea "4". Pues no, resultado vacío de filas. Todos los valores, "1" y "4", están en la tabla t1. ¿Cómo  puede ser esto?

Hay que irse a al manual y comprobar las tablas del nulo. Resumiendo, si utilizamos el x IS NULL podremos obtener un valor verdadero o falso —1 o 0— pero si comparamos como toda la vida se ha hecho

x = NULL, x <> NULL, x < NULL 

el resultado es  es siempre NULL, falso, 0. En MySQL dicen que NULL y 0 significan falso. Cualquier otra cosa, cierto. Incluso NULL = NULL da falso.

Simplifiquemos el ejemplo: select 1 not in (2, 3) es lo mismo que

select (1<>2) and (1<>3) = 1 and 1 = cierto AND cierto = CIERTO

Pero select 1 not in (null, 3) es lo mismo que

select (1<>null) and (1<>3) = 0 AND 1 = falso AND cierto = FALSO.


Fácil. Nulo es nulo en MySQL. O sea, que como hay un nulo en el resultado de la subconsulta (select a from t1), ese nulo podría ser cualquier cosa, concretamente podría ser un "4". 

Para más información, la fuente habitual: http://dev.mysql.com/doc/refman/5.0/en/working-with-null.html.

Avisados quedamos.


(1) C.J. Date, An Introduction to Database Systems, ISBN: 0-321-19784-4.

miércoles, 29 de abril de 2015

Servidor MySQL denuncia a sus usuarios por maltrato

O eso ocurriría si el pobre pudiera hablar. Es recurrente, ocurre todos los años en cuanto llegan los ejercicios que hemos llamado de "aritmética de columna". Hay un ejercicio especialmente gracioso:

T09.017- Cantidad de artículos que no son ni memoria, ni tv, ni objetivo, ni cámara ni pack.
Pongámonos en situación. Los artículos de TiendaOnLine están catalogados en grandes familias como televisores, cámaras, objetivos, etc. Estructuralmente lo que nos encontramos son códigos de artículo que aparecen en una de esas tablas, además de ciertos atributos propios, no comunes a todos los artículos. Todos tienen marca y precio de venta al público (PVP) pero solo los televisores tienen, además, "panel". Es lo que se llama una "generalización": los televisores son artículos, los objetivos son artículos... Por eso hay una tabla general "artículo" y otra, especializada, para cada familia. Estas últimas tienen una clave ajena hacia "artículo" que es, al mismo tiempo, clave primaria de la tabla especializada.

El resultado en nuestra base de datos es cero, todos los artículos están catalogados en alguna de esas familias. Dicho de otra forma, todos los códigos de artículo aparecen en dos de esas tablas, en la de "artículo" —ahí están todos— y en una de las especializadas —o en "tv", o en "objetivo", o en "memoria"...—. Esto es así simplemente por los datos con que hemos cargado la base de datos, con otros datos el resultado podría ser distinto.

Lo gracioso no es esto sino que todos los años MySQL se nos queja de que más de uno intenta

select count(*)
from articulo, camara, objetivo, pack, memoria, tv
where articulo.cod!=camara.cod
and articulo.cod!=tv.cod
and articulo.cod!=pack.cod
and articulo.cod!=objetivo.cod
and articulo.cod!=memoria.cod



Esta barbaridad debería poderse cobrar en forma de sanción administrativo-penal.

Vamos a hacerlo más simple, "cantidad de artículos que no son memoria". Partimos del siguiente estado de base de datos:

domingo, 15 de junio de 2014

Analizando junio 2014

Planteado el qué, vayamos al cómo.

Durante el curso, como ya se ha mencionado, se han realizado 13 pruebas. Son muchas, así que en alguna se puede fallar, no ir, no tener ganas de ir... En cualquier caso, la gran mayoría, alrededor del 85 % del alumnado ha hecho 11 o más de esas pruebas. Hay un poco de trampa, el examen final, solo hay uno, hay que hacerlo si se quiere aprobar. Pero más o menos: el 22 % no se presentó el miércoles 11 de junio y eso se distribuye entre todas las categoría por debajo de 13. Los números de la imagen anterior solo reflejan haberse presentado a los controles, no que se haya obtenido más o menos nota –no se aplica el concepto de aprobado-suspenso hasta el final del todo, en la suma de todas las notas.

sábado, 14 de junio de 2014

Junio de 2014, para olvidar

Ya hemos terminado con la última prueba de la convocatoria de junio de 2014. Toca hacer balance. Pocas ganas tengo...



Sí, es lo que pone, 25 % de aprobados. De 359 matriculados. Quítale los "no presentados" –aquellos que no han hecho ni 6 de las 13 pruebas de evaluación programadas para el curso 2013-2014 en su primera convocatoria– y la cosa se queda en poco más del 27 %. Pobre.

Resumamos brevemente en qué consistía la evaluación de FBD en su convocatoria de junio:

  1. 10 miniexámenes de SQL (hechos en las sesiones de prácticas), a 6 puntos cada uno, 60 puntos.
  2. 2 cuestionarios de teoría, a 25 cada uno, 50 puntos
  3. 1 examen final de problemas de teoría, 40 puntos.

La nota va, pues, de 0 a 150, con el aprobado en 75. El que todavía recuerde mucho el instituto y no se encuentre cómodo con la escala, de 0 a 10 con el aprobado en 5. Se exige un 25 % mínimo de puntuación obtenida en cada una de las partes para hacer la suma de todas las notas obtenidas y optar al aprobado. Si alguna parte falla, la nota máxima es 67.5.

Si distinguimos entre las dos titulaciones que se agregan en los datos anteriores tenemos:


Los resultados en Multimedia son superiores a los de Informática. O los de Informática son escandalosamente peores.

Podemos comparar estos datos con los del curso pasado, para no irnos muy lejos.


Curiosamente, el número de "presentados" es ligeramente superior al del curso pasado, aunque no creo que sea una diferencia significativa –en realidad, el concepto de no-presentado no existe en los grados actuales, pero hay mucha resistencia a abandonarlo y maquilla algunas valoraciones de calidad. En todo lo demás, cuesta abajo y acelerando.

Un 17 % menos de aprobados en global, con una bajada del 21 % en Multimedia. El año pasado no hubo dieces (matrícula de honor, MH), este año hay uno. Sobresalientes, notables y aprobados a la baja. La media de notas obtenida, en picado. La cantidad de gente que no superó el mínimo en los intermedios o en SQL, en la línea. Pero los que no llegaron ni a una pregunta correcta en el examen FINAL, una barbaridad solo comparándolo con el curso pasado.

La materia es la misma, los profesores son los mismos, solo habéis cambiado vosotros. ¿Qué habéis hecho?