Nunca habíamos generado tanta información sobre nosotros mismos y nuestro quehacer. Hoy en día, cada interacción, cada decisión, cada movimiento, deja un rastro que puede medirse, almacenarse y analizarse. Nuestro entorno se ha convertido, sin darnos cuenta, en un experimento en tiempo real. La tendencia apunta a una sociedad cada vez más datificada, donde empresas públicas y privadas, industrias, centros de investigación, entre otros, almacenan información para analizarla y así tomar mejores decisiones. Esta datificación, entendida como el proceso de transformar casi todo lo que hacemos en información tabulada, genera nuevas demandas profesionales: necesitamos personas que den sentido a ese océano de información.
Vivimos un nuevo paradigma. Tenemos la posibilidad de adquirir conocimiento directamente del análisis de grandes volúmenes de datos. Este conocimiento puede ser fundamental, que permita proponer nuevas hipótesis y teorías, o pragmático, que ayude en el día a día tomar decisiones importantes de manera informada. Y esta realidad impulsa el desarrollo de herramientas cada vez más refinadas para el tratamiento de datos. La combinación de la matemática y la estadística, junto con la computación, forman un combo indispensable e indisoluble. Esa intersección es lo que hoy llamamos ciencia de datos.
Esta disciplina, hasta hace poco emergente, enfrenta retos importantes. Uno de ellos es cómo inferir, evitando sesgos, propiedades generales a partir de los datos, pues en la era del big data, cantidad no necesariamente implica representatividad. Otro desafío es crear modelos predictivos más precisos y algoritmos más eficientes, que puedan ejecutar tareas complejas en el menor tiempo posible. Al mismo tiempo, surgen cuestionamientos éticos y filosóficos: ¿cómo garantizar el uso responsable de los datos, sobre todo cuando se tratan de información sensible? ¿qué límites debería tener la inteligencia artificial generativa? Ante el potencial de la automatización en la toma de decisiones, ¿cómo mantener vigente nuestra responsabilidad ética y social?
Con las posibilidades que ofrece la ciencia de datos, nos dirigimos también hacia territorios desconocidos. Desde el estudio de la fiabilidad de dispositivos de escala nanométrica, hasta el diseño de estrategias de inversión. Desde la medicina de precisión y creación de nuevos fármacos, hasta la simulación de políticas en metaversos, por medio de agentes económicos. Esta es su cualidad: la ciencia de datos cruza disciplinas de manera horizontal, pero también transversal, generando conocimiento en diferentes niveles de abstracción.
Por eso resulta fundamental compartir conocimiento en torno a esta bullente área. Son necesarios espacios de diálogo y reflexión sobre un quehacer que ha inundado buena parte de nuestra realidad profesional y académica. Espacios donde podamos compartir experiencias, mostrar avances y aprender unos de otros desde nuestras respectivas trincheras.
El II Congreso Nacional de Ciencia de Datos, organizado por la mesa directiva de la licenciatura en Ciencia de Datos de la UDLAP, busca ofrecer ese espacio plural donde confluyan temas fundamentales y aplicaciones concretas; donde participen alumnos, académicos, practitioners, entusiastas y empresarios. En el evento se explorarán aplicaciones de vanguardia, como el uso de la estadística en nanotecnología o redes neuronales para mejoramiento genético, o estrategias para transformar datos en resultados reales en compañías importantes. Será un espacio para debatir sobre inteligencia artificial generativa, ética en el uso de datos y para desarrollar habilidades prácticas en talleres especializados. Un punto de encuentro para conocer el presente e imaginar el futuro de la ciencia de datos.