Nos gusta mucho (¿o “me” gusta?) hablar de los resultados y las posibilidades que nos abre una estrategia de datos que explote el potencial almacenado junto con la información sobre la que todos estamos sentados. Sin embargo, es raro que nos detengamos a hablar sobre el principio, sobre lo que había antes de los insights y modelos predictivos. Nunca está de más regresar a los básicos, hay muchas iniciativas de datos que se quedan atoradas en el paso uno y puede pasar mucho tiempo antes de darse cuenta de eso.
Existe una creencia en algunos casos de que todo empieza con los datos, cosa que sonaría coherente con una “iniciativa de data”. Normalmente aquí está el primer error. Resulta que no, no empieza con los datos empieza con una necesidad, una pregunta. No empezamos diciendo “quiero todos estos datos a ver qué les hago”, sino que se empieza con un “tengo esta necesidad, ¿será que existen datos que me ayuden a solventarla <mejor>?”. Es decir, no se hace análisis de datos por hacerlo, sino que se está buscando algo, se tiene una necesidad que se persigue y se busca tener resulta de mejor forma incluyendo datos. De otro modo, lo que haríamos es sumergirnos en un universo de datos sin un camino que seguir.
Una vez que tenemos un objetivo nos puede dar por brincar a ver la metodología por usar. “Quiero saber qué productos se venden juntos, agarra los tickets y corre un Market Basket Analysis”. Sí, eventualmente llegaremos a eso, antes tenemos que tener los datos correctos y tenerlos correctos. ¿Qué información me podría ayudar a dar una mejor respuesta? ¿De dónde saco más conocimiento? De lo que tengo a la mano, ¿puedo sacar más? Y la que normalmente se nos va: ¿están bien los datos? El principio es muy sencillo, lo que sale tendrá la misma o menor calidad que lo que entra, de modo que si le insumo no está bien, no podemos esperar mucho. Este suele ser otro de los pasos complicados al momento de querer explotar información, hacerla explotable.
Una vez que ya sabemos qué queremos y que tenemos la información como se necesita, entonces tenemos que frenarnos antes de elegir metodologías y asegurar que cumplimos con los requisitos de contenido, tamaño (o duración en algunos casos), formato, etc. Cada metodología suele pedir algo distinto y hay casos en los que simplemente queremos usar una porque es la que conocemos. No nos vayamos con la inercia, un problema se puede resolver de muchas formas, elijamos la que podemos usar.
Y ahora sí, podemos llegar a lo divertido, explotemos la información y disfrutemos el conocimiento.
¿Tú repasaste los fundamentos antes de arrancar a explotar datos? Si aún no has empezado, ¿consideraste que necesitas hacer algunas cosas antes? Si te los has brincado, ¿cómo te fue?