Google Cloud anunció la disponibilidad general de las optimizaciones basadas en el historial de BigQuery, que pueden acelerar el rendimiento de las consultas hasta 100 veces. Esta nueva función está diseñada para aprender de ejecuciones de consultas anteriores e identificar mejoras adicionales que se pueden aplicar a ejecuciones futuras.
Un aspecto interesante de las optimizaciones basadas en el historial de BigQuery es su capacidad para mejorar diferentes tipos de consultas, incluidas aquellas que implican combinaciones altamente selectivas. Por ejemplo, si BigQuery identifica una combinación que da como resultado un número mucho menor de filas que su entrada, puede optar por ejecutar esa combinación antes en el plan de ejecución. Esto puede reducir significativamente la cantidad de datos que deben procesarse, lo que lleva a mejoras generales en el rendimiento.
Además, las optimizaciones basadas en el historial de BigQuery pueden ayudar a reducir la cantidad de datos que BigQuery escanea insertando operaciones de semi-unión selectivas en toda la consulta. En algunos casos, BigQuery puede identificar una combinación altamente selectiva (similar a la inserción de combinación) en una consulta con varias rutas de ejecución paralelas que finalmente se unen. BigQuery puede insertar nuevas operaciones de "semi-unión" basadas en la unión selectiva que "reduce" la cantidad de datos escaneados y procesados por esas rutas de ejecución paralelas.
En general, las optimizaciones basadas en el historial de BigQuery son una valiosa adición a BigQuery. Al aprovechar los datos históricos de ejecuciones de consultas anteriores, esta nueva función puede mejorar significativamente el rendimiento de las consultas y reducir los costos. Además, dado que funciona automáticamente, los usuarios pueden beneficiarse de estas mejoras sin tener que realizar ningún cambio en sus consultas.