En Unidad de Data Science de la Universidad de Concepción te invitamos a realizar tu práctica con nuestro equipo. Podrás trabajar en proyectos desafiantes formando parte de un equipo integrado por ingenieros, ingenieras y data scientists de alto nivel.
Para postular, envía un email a uds@inf.udec.cl incluyendo:
- Informe de notas
- Un párrafo describiendo tu interés y el tema de preferencia en caso de tenerlo (ver temas abajo).
Fecha de término postulaciones: 17 de diciembre 2023.
Toda práctica realizada con nosotros incluye una remuneración bruta mensual de $200.000 con dedicación full time.
ALeRCE (https://alerce.online/)
Los telescopios de última generación están monitoreando constantemente el cielo en búsqueda de objetos astronómicos interesantes y desconocidos. Cientos de miles de alertas por noche son producidas por estos telescopios y en el futuro llegarán a ser millones. Una alerta se genera cada vez que un objeto cambia ya sea en posición o brillo con respecto a una imagen de referencia (e.g. explosión de estrellas, asteroides u objetos periódicos, entre otros). ALeRCE (Automatic Learning for the Rapid Classification of Events) es un sistema integrado que apunta a la rápida clasificación de los eventos provenientes de telescopios de rastreo con el fin de seleccionar automáticamente a los candidatos relevantes a ser seguidos. Actualmente estamos buscando practicantes en las áreas de machine learning para el desarrollo de algoritmos de detección de anomalías para ALeRCE.
Requisitos: Programación en Python y alguna asignatura relacionada a Ciencia de Datos
Duración: 2 meses
Deephub
Deephub es una herramienta para el monitoreo de especies a partir de imágenes georeferenciadas. La herramienta utiliza diversos algoritmos de deep learning para el conteo, detección, segmentación y clasificación de objetos, proporcionando información área de gran relevancia para diversos sectores en nuestro país. El objetivo de esta práctica es la investigación de modelos fundacionales de visión computacional para el apoyo a las labores de etiquetado manual requeridas para el entrenamiento de modelos supervisados en Deephub.
Requisitos: Programación en Python y alguna asignatura relacionada a Ciencia de Datos
Duración: 2 meses
Integración de Información LiDAR con imágenes aéreas para la estimación de biomasa y carga combustible en el proyecto institucional de la Universidad de Concepción, Campus Naturaleza
El proyecto institucional Campus Naturaleza busca, en términos generales, la reconversión de uso de suelo en el predio La Cantera el Guindo, patrimonio forestal de la Universidad de Concepción. Específicamente pasar de un uso forestal productivo hacia una superficie plantada y restaurada con bosque nativo. Esto podría repercutir en disminuir la cantidad de biomasa y carbono almacenada en el sitio por las plantaciones forestales. Por otro lado, habrían alcances positivos, principalmente con el aumento de la biodiversidad y la disminución de la carga de combustible. Esto hace fundamental tener una cuantificación y caracterización de biomasa en el bosque, y para ello se dispone de información LiDAR e imágenes aéreas la cual permitiría generar herramientas eficaces que ayuden en la toma de decisiones y en concentrar los esfuerzos de la gestión forestal del proyecto Campus Naturaleza.
Requisito deseable: Conocimientos o experiencia en manipular y procesar imágenes aérea
Duración: 1 mes
Desarrollo de sistemas de control model-free basados en reinforcement learning
En la época actual, existe gran disponibilidad de datos que nos permiten realizar diferentes tareas de operación sobre realidades físicas, tales como modelar, monitorear, controlar y optimizar. En este sentido, los sistemas de control son útiles para que nuestra realidad física o proceso opere en condiciones seguras y confiables, a la vez que permiten asegurar la robustez ante perturbaciones y el seguimiento de referenciales para alcanzar una operación óptima. Muchos sistemas de control se basan en un modelo del proceso, lo cual limita su desempeño a la precisión de dicho modelo. Recientemente [2-5] proponen una nueva tendencia en sistemas de control que no requieren conocer un modelo del proceso y que ajustan sus parámetros con métodos de inteligencia artificial, esencialmente Reinforcement Learning (RL). El objetivo de la práctica es desarrollar experimentos numéricos en Python que sean conducentes a una primera aproximación de sistemas de control cuyos parámetros se ajusten mediante RL sobre procesos lineales de primer y segundo orden, habilitando su evaluación considerando indicadores de desempeño de la precisión del controlador y costo computacional.
Requisitos: Haber realizado cursos de: reinforcement learning, optimización
Continuidad: Extensión a proyecto de tesis de pregrado o postgrado
Duración: 2 meses
Extendiendo capacidades de Análisis de Vulnerabilidades en Chatbots Basados en Grandes Modelos de Lenguaje (LLMs)
En el marco de nuestros esfuerzos continuos por innovar en el campo de la seguridad informática, nos hemos embarcado en el desarrollo de una herramienta avanzada para el análisis de vulnerabilidades en chatbots impulsados por Modelos de Lenguaje de Aprendizaje Profundo (LLMs). Actualmente, estamos diseñando métricas universales, que no dependen del propósito específico del chatbot. Esta metodología se inspira en herramientas de análisis de vulnerabilidades de software, que operan de manera independiente al ámbito de aplicación del software analizado, tomando como referencia estándares como el Sistema de Puntuación de Vulnerabilidades Comunes (CVSS) y diversas normativas internacionales.
El objetivo principal de esta práctica es investigar y desarrollar mecanismos de evaluación que ahora se centren en el dominio operativo del chatbot. Para ello, se utilizarán técnicas como la Generación de Respuestas y Argumentación (RAG), y/o el ajuste fino (finetuning) para generar consultas automáticamente en base a conocimiento del dominio de aplicación y evaluar automáticamente la calidad de las respuestas. El fin último es ampliar el alcance de las pruebas automáticas aplicables a los chatbots, integrándolas en nuestra herramienta en desarrollo.
El practicante se unirá a un equipo de trabajo recientemente establecido, enfocado en la seguridad de los Modelos de Lenguaje de Aprendizaje Profundo (LLM Security), donde tendrá la oportunidad de contribuir a un proyecto innovador y de vanguardia en el campo de la ciberseguridad.
Requisito excluyente: Dominio de programación en Python.
Requisitos deseables: Conocimientos en Procesamiento de Lenguaje Natural (NLP) y experiencia en el uso de APIs para Modelos de Lenguaje de Aprendizaje Profundo (LLMs)
Duración: 2 meses
Implementación de una política de evasión de colisiones sim-to-real mediante aprendizaje por refuerzo
Un equipo de investigación de la Universidad de Minnesota ha desarrollado un método de aprendizaje por refuerzo que permite a dos robots navegar entre dos puntos sin colisionar. En esta práctica, el objetivo es replicar el comportamiento obtenido en simulación en un sistema de dos robots Turtlebot3. Para esta práctica es necesario conocimiento de robótica y del framework ROS. También es deseable familiaridad con los robots Turtlebot3.
Requisitos: Haber cursado el taller de programación de robots y/o tener experiencia con ROS
Duración: 1 mes
Localización mediante procesamiento de datos del sensor LIDAR en sistemas de múltiples robots.
Un desafío crucial en el diseño e implementación de sistemas multi robot es cómo cada robot localiza a otros en su vecindad. En el caso de los Turtlebot3, estos cuentan con un radar tipo Lidar de 2D, que puede ser utilizado para determinar la posición de objetos a su alrededor. En esta práctica se implementará un mecanismo de localización de un robot, utilizando como entrada el arreglo de puntos obtenido por el uso del Lidar. Para esta práctica es necesario conocimiento de robótica y del framework ROS. También es deseable familiaridad con los robots Turtlebot3.
Requisitos: Haber cursado el taller de programación de robots y/o tener experiencia con ROS
Duración: 1 mes
Transformación Digital en Salud orientada a pacientes con enfermedades crónicas
Los sistemas sanitarios de los países occidentales, incluido Chile, enfrentan un nuevo desafío para los próximos años: una creciente demanda de prestaciones de salud y recursos que no están creciendo con la misma rapidez. Con el ánimo de no comprometer la calidad de la atención, creemos que la incorporación de la inteligencia artificial permitirá acortar las brechas de información en la relación médico paciente. Particularmente la disponibilidad de herramientas de inteligencia de datos orientada a los profesionales de la salud. El objetivo de la práctica es introducir una arquitectura de datos y control de mando en la plataforma interna de una clínica de la comuna de Concepción, con el fin de modelar regímenes de tratamiento médico y explorar las consecuencias del uso de distintas alternativas de optimización de procesos. Para desempeñar la práctica se requiere del manejo de Python así como de estructuras de datos. El practicante será inducido al contexto del problema y colaborará de manera directa para proponer la mejor alternativa posible desde la perspectiva del cliente y los desarrolladores.
Requisitos excluyentes: Programación en python y arquitectura de datos
Requisitos deseables: experiencia en UI/UX
Duración: 2 meses a media jornada
Recomendaciones personalizadas de actividad física para clientes CESFAM
El Centro de Vida Saludable (CVS) de la Universidad de Concepción desarrolló la plataforma App-tivate, con el fin de motivar a pacientes del CESFAM a realizar actividades físicas saludables. La evidencia indica que la personalización puede contribuir de forma sustancial a la capacidad de completar metas y generar la adopción de comportamientos saludables en el tiempo. Para ello se pretende ampliar las capacidades actuales de App-tivate para incluir modelos de personalización basados en algoritmos de aprendizaje por reforzamiento. El objetivo de la práctica es explorar la viabilidad e introducir un algoritmo de recomendación (contextual bandits) en la plataforma (app y web) que el CVS mantiene en licencia a los CESFAM y explorar las consecuencias del uso de distintas alternativas de algoritmo. Para desempeñar la práctica se requiere del manejo de Python así como de estructuras de datos. El practicante será inducido al contexto del problema y colaborará de manera directa para proponer la mejor alternativa posible desde la perspectiva del usuario final y los desarrolladores.
Requisitos excluyentes: Programación en python y arquitectura de datos
Requisitos deseables: experiencia en UI/UX
Duración: 2 meses a media jornada