Contestar a esta pregunta puede ser el mejor camino para plantearse algo aún más interesante, y es lo que nos acabará aportando el procesamiento de lenguaje natural (PNL). Para ello observemos el caso de internet y cómo el PLN puede ayudar a que nos sea más útil.
El crecimiento de los datos generados en la red es exponencial. Hay mucha información en la nube, demasiada. El problema ahora es el acceso a la información que queremos. La capacidad de acceder a esos datos, gestionarlos y ordenarlos por relevancia, es lo que ha hecho que buscadores como Google hayan tenido tal éxito.
Imaginemos que internet fuera un gran libro en constante crecimiento. Este gran libro es demasiado extenso y crece demasiado rápido para que nadie se lo pueda leer, por lo que se crean bibliotecarios especializados en leer continuamente cada capítulo que se añade al gran libro (son los buscadores). Imaginemos, además, que hay un bibliotecario aventajado que idea un método para ordenar los capítulos asignando a cada uno un valor según la relevancia que tiene. Así, cuando alguien busca una información, automáticamente aparecen ordenadas por relevancia las páginas del gran libro que tuviesen la información relativa a un determinado capítulo.
Al principio esos bibliotecarios buscarían únicamente coincidencias entre las palabras que se escriben y las que se encuentran en las páginas del gran libro. Pero poco a poco no solo aprenderían a ofrecer resultados a partir de coincidencias exactas, sino a aplicar conocimiento de base lingüística para entender mejor qué resultados nos pueden interesar cuando buscamos algo. Es decir, se irían convirtiendo en bibliotecarios personales.
Pero para que la interacción con nuestro bibliotecario personal sea efectiva, será necesario que le podamos pedir información y que nos responda como si fuese de carne y hueso. Hará falta que sepa procesar el lenguaje natural y «generarlo». Por lo tanto, el procesamiento de lenguaje natural podemos entenderlo como el profesor de lengua encargado de enseñar a estos bibliotecarios, y a todo sistema informático que necesite de una base lingüística para realizar o mejorar sus funciones (correctores ortográficos, teclado predictivo, buscadores, sistemas de comunicación hombre-máquina, etc.).
Otra aplicación del PLN es la minería de datos. Y una parte muy en boga últimamente de la minería de datos es la reputación digital. En este caso, el PLN intenta enseñar a analistas automáticos a que identifiquen las valoraciones que hace la gente en las redes sociales sobre productos, empresas, personas de interés general, etc. El objetivo es abrir un canal de comunicación más directo entre oferta y demanda, necesidad y servicio, resultado y expectativa. ¿Qué dicen mis clientes de mí? ¿En qué puedo mejorar? ¿Cómo puedo hacerlo? El PLN enseña a este analista a extraer la información que ayude a responder estas preguntas.
Pero para que el profesor PLN llegue a formar a alumnos realmente competentes, queda mucho camino por andar. Se requiere de un gran esfuerzo para dar los primeros pasos, pero una vez dados, empezar a correr es algo inminente.