Búsqueda Web

La importancia de la búsqueda web para los grandes modelos de lenguaje

Una de las limitaciones más conocidas de los grandes modelos de lenguaje es que no tienen conocimiento sobre las noticias y sucesos ocurridos en los últimos meses. Esa falta de información puede ser de 5 o 6 meses, o incluso más.

Esto ocurre porque los datos usados para su entrenamiento tienen una fecha de corte. Los modelos se entrenan con un corpus enorme de información  durante un tiempo prolongado. En determinado momento ese entrenamiento finaliza, y comienza el proceso de ajuste y “alineación” antes de que puedan ser puestos a disposición del público. La “alineación” es importante porque un modelo recién entrenado puede responder “sin filtros” con instrucciones peligrosas (como fabricar armas, sustancias tóxicas, diseñar estafas y hackeos) o con opiniones cargadas de sesgos inconvenientes (racismo, xenofobia, sexismo, opiniones políticas radicales), etc. La alineación trata de evitar estos riesgos y problemas.

El proceso de alineación es complejo y puede llevar meses. Por eso, cuando un modelo se publica ya se encuentra desactualizado, es decir, no tiene conocimiento sobre las noticias y sucesos que han ocurrido desde el momento que finalizó su entrenamiento hasta que se pone en línea.

En este contexto es donde cobra relevancia la búsqueda web. Cuando habilitamos la búsqueda web le estamos pidiendo al modelo que busque información actualizada en internet para elaborar su respuesta, cubriendo de ese modo el bache de información.

Está claro que la importancia de la búsqueda web depende del tema que estemos investigando. En la mayoría de los casos la búsqueda web resulta poco importante, porque la información reciente sobre un determinado tema no tiene relevancia (conceptos teóricos consolidados de filosofía, economía e historia; problemas científicos, etc.). Pero en otros casos la búsqueda permite que el modelo de una respuesta que de otro modo no podría elaborar (consultas sobre sucesos políticos, culturales o deportivos recientes, por ejemplo). Debemos tener esto en cuenta para decidir si activamos o no la búsqueda web.

Un comentario sobre el aprendizaje y la búsqueda web. Como hemos mencionado, los modelos tienen un conocimiento cristalizado a determinada fecha de corte. Es decir, los modelos “aprenden” durante el entrenamiento, pero luego de eso ya no pueden incorporar información nueva. Esta es una limitación importante y recién ahora se están proponiendo arquitecturas y algoritmos que permitan algo más parecido a un aprendizaje continuo; es decir, algo más parecido a como los seres humanos vamos actualizando los conocimientos de manera permanente.

La búsqueda web le permite al modelo tomar conocimiento de sucesos recientes pero tiene ciertas limitaciones. Por un lado, esa información no se asimila ni “aprende” del mismo modo que la información utilizada en la etapa de entrenamiento. Por otro lado, y como corolario de lo anterior, esa información no se almacena en memoria ni queda disponible para futuras consultas, se utiliza para elaborar una respuesta específica y luego se olvida. Finalmente, es probable que una búsqueda web puntual obtenga como resultado información más limitada, o sesgada, que la utilizada en la etapa de entrenamiento (pensemos que los modelos se entrenan con la mayor cantidad posible de información disponible).

En resumen, la búsqueda web es útil porque sirve a los modelos para que puedan responder sobre eventos recientes o actuales. No obstante, debemos tener en cuenta que para estos temas es posible que la calidad de la respuesta sea de menor calidad.

Cómo activar la búsqueda web

Activar la búsqueda web es muy sencillo. En algunos chats actuales ya ni siquiera es necesario; cuentan con una capa de análisis que decide por el usuario si es necesario complementar la información del modelo con una búsqueda web en función de la consulta realizada. Gemini y Grok, por ejemplo, deciden por sí mismos si la consulta amerita la búsqueda web. ChatGPT es un caso mixto: puede hacer una búsqueda web automática cuando lo considere necesario, pero también ofrece una opción para configurar.

ChatGPT

Y en varios modelos existe una opción disponible que debe configurarse explícitamente. Ejemplos:

Claude
Qwen
DeepSeek

Scroll al inicio