Karthik Bhimarasetti
Date d'abonnement : 2022
Ligue d'Argent
1571 points
Date d'abonnement : 2022
Ce cours présente une solution de génération augmentée par récupération (RAG) dans BigQuery permettant de réduire les hallucinations de l'IA. Il décrit un workflow RAG qui couvre la création d'embeddings, la recherche dans un espace vectoriel et la génération de réponses améliorées. Il explique aussi les raisons conceptuelles derrière ces étapes et leur implémentation pratique avec BigQuery. À la fin du cours, les participants seront à même de créer un pipeline de RAG à l'aide de BigQuery et de modèles d'IA générative tels que Gemini, ainsi que des modèles d'embeddings pour traiter leurs propres cas d'hallucinations de l'IA.
Bien que les approches traditionnelles utilisant des lacs de données et des entrepôts de données puissent être efficaces, elles présentent des inconvénients, en particulier dans les grands environnements d'entreprise. Ce cours présente le concept de data lakehouse et les produits Google Cloud utilisés pour en créer un. Une architecture de lakehouse utilise des sources de données basées sur des normes ouvertes et combine les meilleures fonctionnalités des lacs et des entrepôts de données, ce qui permet de pallier de nombreuses lacunes.
Ce cours présente les produits et services Google Cloud pour le big data et le machine learning compatibles avec le cycle de vie "des données à l'IA". Il explore les processus, défis et avantages liés à la création d'un pipeline de big data et de modèles de machine learning avec Vertex AI sur Google Cloud.