Stages - Data Science
- Au sein de nos bureaux Toulousains, vous rejoindrez une équipe de data scientists spécialisée en deep learning, traitement d'images et géomatique, dédiée à la R&D sur notre plateforme delair.ai. L'équipe se concentre sur l'analyse de données variées, comme des images de drones, des nuages de points LIDAR et des modèles CAO.
Ce que vous allez acquérir :
- Une expérience pratique avec des technologies d'IA/ML de pointe et des applications concrètes.
- L'opportunité de travailler sur un projet à fort impact qui contribuera directement à l'efficacité de nos opérations.
- Un mentorat assuré par des professionnels expérimentés en IA/ML.
- Un environnement de travail collaboratif qui valorise la créativité, l'innovation et le développement professionnel.
Différentes thématiques peuvent être envisagées selon votre profil :
Détection de changement à l'aide du Deep Learning
Vue d'ensemble du stage :
Votre mission principale consistera à développer un workflow pour détecter les changements dans les scènes à partir d'images aériennes hautes résolution et LiDAR.
Les objectifs du stage sont les suivants :
-
État de l'art et constitution de datasets : Vous commencerez par réaliser un état de l'art des techniques de détection de changement basées sur le deep learning. Ensuite, vous constituerez des jeux de données en exploitant les données disponibles sur notre plateforme (images drone, satellites, LiDAR, etc.) afin de préparer les bases nécessaires pour le développement et la validation des modèles.
- Conception de nouveaux modèles : Vous implémenterez et testerez les différentes approches et architectures de réseaux de neurones pour détecter les changements à partir de deux scènes.
- Évaluation des performances : Vous serez responsable de la validation et de l'évaluation des modèles en termes de précision et performance, sur des jeux de données réels.
Compétences recherchées :
- Formation en informatique, mathématiques appliquées, traitement d'images, vision par ordinateur, ou domaine connexe.
- Solides connaissances en deep learning et réseaux de neurones (PyTorch, etc…).
- Intérêt ou connaissances dans les données spatiales.
- Compétences en programmation (Python).
Liens utiles pour préparer votre candidature :
-
https://www.mdpi.com/2072-4292/16/13/2355
-
https://github.com/MinZHANG-WHU/Change-Detection-Review
-
https://github.com/ChenHongruixuan/MambaCD
-
https://www.sciencedirect.com/science/article/pii/S0924271623000849#tbl6
-
https://www.sciencedirect.com/science/article/abs/pii/S0924271623000394
- https://github.com/wsunid/awesome-point-clouds-registration
Détection et classification d'espèces d'arbres avec des données Lidar
Vue d'ensemble du stage : Ce stage s'inscrit dans le cadre de l'utilisation de techniques avancées de deep learning pour l'analyse des données géospatiales, notamment les données LiDAR et les images satellites. L'objectif est d'explorer leur potentiel pour la détection et l'identification des espèces d'arbres dans des environnements variés. Le LiDAR, grâce à sa capacité à fournir des informations 3D précises sur la structure de la végétation, combiné à la résolution multispectrale et hyperspectrale des données satellites, offre une opportunité unique pour une classification détaillée des espèces d'arbres. L’utilisation de modèles d’apprentissage profond permettra d'améliorer l’automatisation et la précision des méthodes de gestion de la végétation.
Compétences recherchées :
- Formation en informatique, mathématiques appliquées, traitement d'images, vision par ordinateur, ou domaine connexe.
- Solides connaissances en deep learning et réseaux de neurones (PyTorch, etc…).
- Compétences en programmation (Python, C++ est un plus).
- Intérêt pour les technologies de drone et la modélisation 3D des infrastructures industrielles.
Liens utiles pour préparer votre candidature:
- https://www.mdpi.com/2072-4292/13/12/2297
- https://research.facebook.com/blog/2023/4/every-tree-counts-large-scale-mapping-of-canopy-height-at-..
- https://essd.copernicus.org/articles/15/681/2023/
- https://www.arxiv.org/pdf/2408.06507
- https://zenodo.org/records/13255198
Développement de système de questions-réponses basées sur des LLM
Vue d'ensemble du stage :
Nous recherchons un stagiaire en IA/ML hautement motivé pour participer au développement d'un système interne de questions-réponses basé sur un Large Language Model (LLM). Ce système utilisera notre vaste base de connaissances interne pour fournir des réponses précises et contextuelles aux questions des employés, rationalisant ainsi la communication et améliorant la productivité dans tous les départements.
Responsabilités principales :
- Collaborer avec notre équipe IA/ML pour concevoir et développer un système basé sur un LLM capable de comprendre et de répondre aux questions à partir de notre base de connaissances interne.
- Prétraiter, nettoyer et organiser les données de la base de connaissances interne afin de les optimiser pour l'entraînement du LLM.
- Ajuster les modèles LLM existants pour les adapter à la terminologie, aux processus et aux connaissances spécifiques de l'entreprise.
- Tester et évaluer les performances du système, en mettant en œuvre des améliorations basées sur les retours et les résultats des tests.
- Documenter le processus de développement, y compris les défis, solutions et bonnes pratiques.
- Travailler en étroite collaboration avec des équipes interfonctionnelles pour comprendre leurs besoins et s'assurer que le système basé sur le LLM répond à leurs exigences.
Compétences recherchées :
- Actuellement en cours d'obtention d'un diplôme en informatique, science des données, IA/ML ou un domaine connexe.
- Expérience avec Python et les frameworks ML populaires (par exemple, TensorFlow, PyTorch).Familiarité avec les LLMs (par exemple, GPT, BERT) et expérience dans l'ajustement de modèles.
- Excellentes compétences en résolution de problèmes et capacité à travailler de manière autonome ainsi qu'en équipe.
- Expérience en prétraitement de données et techniques d'évaluation de modèles.
- Familiarité avec les plateformes cloud (par exemple, AWS, Google Cloud) et les systèmes de contrôle de version (par exemple, Git).
- Expérience préalable avec des systèmes de gestion des connaissances ou des projets similaires.
Liens utiles pour préparer votre candidature :
- https://leanpub.com/transformers-large-language-model
- https://ollama.com/library/phi3
- https://github.com/QwenLM/Qwen2
- LASER Blog
- Literature survey on low rank approximation of matrices
- https://ai.google.dev/gemma/docs
- QLoRA: Efficient Finetuning of Quantized LLMs
- LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS
- The Truth is in There: Improving Reasoning in Language Models with Layer-Selective Rank Reduction (LASER)
- https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard
Reconstruction 3D par Deep Learning
Vue d'ensemble du stage :
Votre mission principale sera de développer des algorithmes de reconstruction 3D d'infrastructures industrielles complexes à partir d'images capturées par drones, en utilisant des méthodes basées sur le deep learning.
Les objectifs du stage sont les suivants :
- État de l'art et constitution de datasets : Vous commencerez par réaliser un état de l'art des techniques de reconstruction 3D basées sur le deep learning. Ensuite, vous constituerez des jeux de données en exploitant les données disponibles sur notre plateforme (images drone, nuages de points, etc.) afin de préparer les bases nécessaires pour le développement et la validation des modèles.
- Conception de nouveaux modèles : Vous implémenterez et testerez différentes architectures de réseaux de neurones visant à améliorer la qualité des reconstructions 3D, en tenant compte de la précision géométrique et de la robustesse face aux conditions réelles de capture (variation d'éclairage, angles de vue limités, etc.).
- Optimisation des performances : Vous serez responsable de la validation et de l'évaluation des modèles en termes de précision géométrique et de performance, sur des jeux de données réels issus de relevés drone.
Compétences recherchées :
- Formation en informatique, mathématiques appliquées, traitement d'images, vision par ordinateur, ou domaine connexe.
- Solides connaissances en deep learning et réseaux de neurones (PyTorch, etc…)
- Intérêt pour les technologies de reconstruction 3D et modélisation géométrique.
- Compétences en programmation (Python, C++ est un plus).
- Intérêt pour les technologies de drone et la modélisation 3D des infrastructures industrielles.
Liens utiles pour préparer votre candidature :
- https://arxiv.org/abs/2003.0893
- https://nesf3d.github.io/
- https://nianticlabs.github.io/acezero/
- https://arxiv.org/abs/2406.09756
- https://github.com/colmap/glomap
Évaluation de Techniques de Détection de Changement avec Données SAR
Vue d'ensemble du stage : La détection de changement à partir de données radar à synthèse d'ouverture (SAR) est une technique utilisée pour identifier les variations survenant dans une zone au fil du temps. Grâce à sa capacité à capturer des images indépendamment des conditions météorologiques ou de luminosité, le SAR est particulièrement efficace pour surveiller des environnements difficiles comme les zones forestières, urbaines ou côtières. Cette technologie permet de repérer des changements liés à des phénomènes naturels (inondations, glissements de terrain) ou à des activités humaines (déforestation, urbanisation), en comparant des images prises à des moments différents.
Dans ce stage, nous allons explorer et tester différentes techniques de détection de changement appliquées aux données SAR, notamment l'interférométrie, le deep learning et d'autres approches avancées. Nous utiliserons des images provenant de la mission Sentinel-1 ainsi que de constellations SAR commerciales. L'objectif sera d'évaluer l'efficacité et la précision de chaque méthode pour diverses applications, telles que la surveillance environnementale et urbaine, en comparant les résultats obtenus avec ces différentes sources de données.
Compétences recherchées :
- Formation en informatique, mathématiques appliquées, traitement d'images, vision par ordinateur, ou domaine connexe
- Solides connaissances en deep learning et réseaux de neurones (PyTorch, etc…).
- Intérêt pour les technologies d radar à synthèse d'ouverture (SAR)
- Compétences en programmation (Python, C++ est un plus)
Liens utiles pour préparer votre candidature :
- https://www.youtube.com/@EarthScope_presentations/playlists
- https://www.earsel.org/symposia/2005-symposium-Porto/pdf/008.pd
- https://radar.community.uaf.edu/module-iii-advanced-radar-concepts/
- https://www.sto.nato.int/publications/STO%20Educational%20Notes/STO-EN-SET-172-2013/EN-SET-172-2013-09.pdf
- https://www.tandfonline.com/doi/abs/10.1080/01431169108929656
- Department
- Engineering
- Role
- Data Scientist
- Locations
- Toulouse
- Remote status
- Temporarily Remote
Toulouse
Alteia is a leading enterprise A.I software provider focused on streamlining the use of visual data to generate real-time business intelligence.
Developing and deploying visual intelligence at scale requires the use of complex technology stacks where algorithms and models need to be placed at the center of business operations. That’s why Alteia delivers a family of integrated products that have been purpose-built to accelerate the implementation of A.I applications, making quick work of large data sets from disparate systems:
- The Alteia software platform to rapidly contextualize large amounts of disparate data and operate enterprise A.I applications quickly.
At Alteia, we can provide a unique opportunity to gain valuable experience in a fast-growing business. We expect technical excellence, and although there may be challenges, we value our employees' creativity and personal development. As such, we encourage out-of-the-box ideas and incentivize innovation.
You will make a difference every day, as you'll have a hand in transforming key industry sectors as they move towards driving their operations with visual data and AI.
About Alteia
We create software that enables organizations to effectively integrate their visual data, decisions and operations. We make products for human-driven analysis of real-world data, accelerated with artificial intelligence, that empower people to solve complex problems.
Stages - Data Science
Loading application form