Dieser Kurs gibt Machine-Learning-Anwendern alle grundlegenden Tools, Techniken und Best Practices zur Bewertung von generativen und prädiktiven KI-Modellen an die Hand. Die Modellbewertung ist ein wichtiger Schritt, bei dem geprüft wird, ob ML-Systeme in der Produktion zuverlässige, genaue und leistungsstarke Ergebnisse erzielen. Die Teilnehmer erwerben fundierte Kenntnisse über verschiedene Bewertungsmesswerte und -methoden und lernen, sie auf unterschiedliche Modelltypen und Aufgaben anzuwenden. Im Kurs wird schwerpunktmäßig auf die besonderen Herausforderungen generativer KI-Modelle eingegangen und es werden Strategien vorgestellt, wie sich diese effektiv bewältigen lassen. Die Teilnehmer lernen auf der Plattform Vertex AI von Google Cloud, robuste Bewertungsprozesse zur Auswahl, Optimierung und kontinuierlichen Überwachung des Modells zu implementieren.
This course delves into the complexities of assessing the quality of large language model outputs. It examines the challenges enterprises face due to the subjective and sometimes incorrect nature of LLM responses, including hallucinations and inconsistent results. The course introduces various evaluation metrics for different tasks like classification, text generation, and question answering, such as Accuracy, Precision, Recall, F1 score, ROUGE, BLEU, and Exact Match. It also explores evaluation methods offered by Vertex AI LLM Evaluation Services, including computation-based, autorater, and human evaluation, providing insights into their application and benefits. Finally, the module covers how to unit test LLM applications within Vertex AI.
Model Garden is a model library that helps you discover, test, and deploy models from Google and Google partners. Learn how to explore the available models and select the right ones for your use case. And how to deploy and interact with Model Garden models through the Google Cloud console and APIs.