课程费用

5800.00 /人

课程时长

3

成为教练

课程简介

本课程为期三天,深入探讨人工智能生成创作(AIGC)与大语言模型的核心技术与应用,涵盖从基础理论到企业落地的全流程。课程内容包括大模型原理、提示工程、数据清洗、参数微调、分布式训练、多模态生成、强化学习及推理加速等关键领域。通过对DeepSeek、Qwen等主流开源模型的剖析,以及RAG框架、向量数据库等企业级应用的实战演练,学员将掌握大模型部署、优化与产品化的核心技能。课程结合金融、法律等行业案例,融入数据清洗、模型微调及量化实战,帮助学员快速上手AI技术并应用于实际业务场景,适合AI从业者与企业技术团队。

目标收益

掌握大语言模型的核心原理与提示工程技巧,熟练运用DeepSeek、Qwen等主流开源模型进行文章写作、代码生成及行业报告自动生成等任务;通过数据清洗、参数微调及分布式训练实战,提升模型在金融、法律等领域的应用能力;学会构建RAG框架及向量数据库,实现智能问答与知识库系统的企业级落地;深入理解多模态生成与推理加速技术,优化模型性能并降低部署成本;结合真实案例与产品化经验,学员能够将AI技术快速转化为业务价值,提升团队竞争力。

培训对象

课程内容

第一天-上午
1. 课程开场与AIGC综述(1h)
大模型原理概述,介绍课程的目标和预期的学习成果。
介绍人工智能生成创作(AIGC)领域的基本概念、应用和发展趋势,相关场景及算法基础逻辑介绍
2. 大模型应用与提示工程(1.5h)
大模型提示词设计,多场景提示词设计,文章写作辅助、代码生成与调试、自动回复常见问题等
面向DeepSeek R1系类大模型的提示词设计技巧
介绍基于大模型的高效办公应用方法,利用DeepSeek等相关大模型完成行业报告自动生成框架设计、营销文案多风格生成等相关任务
课程实战:大模型部署实战——基于DeepSeek的大模型部署及API调用(0.5h)
第一天-下午
1. 主流开源语言大模型介绍与比较(1.5h)
主流大模型介绍,详述DeepSeek、Qwen 等系类大模型的应用、介绍ChatGLM、Llama、bloom、MOSS、Baichuan、Skywork等开源模型
针对相关业务场景,分析大模型的选型
领域大模型介绍——法律、医疗、金融、教育等领域大模型介绍
2. 领域高质量数据构造与清洗(1h)
梳理大模型训练中的数据收集方法与数据清洗逻辑
介绍基于Self-instruct的数据构造方法、介绍面向结构化知识的数据构造方法
高质量数据收集与清洗分享——以参与的开源数据集Chinese-DeepSeek-R1-Distill-data-110k为例
领域数据清洗方法介绍——IFD指标法、MoDS方法等
课程实战:数据清洗与收集实战——面向金融领域的数据清洗与挖掘(0.5h)
第二天-上午
1. 大语言模中的高效参数调优方法(1.5h)
常用参数微调方法——Prefix Tuning、P-Tuning、LoRA
微调方法进阶——DyLoRA、AdaLoRA、QLoRA、QALoRA、LongLoRA、VERA、S-LoRA
2. 分布式训练基础介绍(1h)
介绍当前常用的模型分布式计算方法,详细介绍数据并行、向量并行、流式并行的多种并行策略等
介绍常见的分布式训练框架,如Megatron、DeepSpeed、Colossal-AI、FairScale等分布式训练框架介绍
DeepSpeed框架详述,介绍ZeRO-1、ZeRO-2、ZeRO-3多种分布式策略
课程实战:大模型微调实战——基于Qwen的微调实战(0.5h)
第二天-下午
1. 大模型中的强化学习概述(1h)
大模型中的奖励模型,包括介绍奖励模型基础、数据设计及模型训练方法
偏好对齐算法介绍——RRHF、RLAIF、DPO、APO等
DeepSeek中的强化学习方法GRPO原理及应用
2. 多模态生成方法与原理介绍(1h)
图片生成文本(Image Captioning)的基本概念介绍
基于于大模型(如Transformer)的图片生成文本技术的核心原理
图片生成文本的落地应用,如社交媒体与内容创作、辅助视觉障碍人士、医疗健康、教育与科研等
介绍图生文相关模型概念,如QwenVL系类、Yi-VL等
3. Manus系列概述(1h)
介绍Manus相关内容概述,与操作方法简述
OpenManus开源框架概述与本地化部署
OWL开源多智能体协作框架概述
第三天-上午
1. 深度文档处理技术实战(1h)
基于传统模型的文档数字化解析的技术原理与点滴
基于多模态文档解析:如PDF复杂表格识别、基于图片的直接问答交互等
文档综合拆解、版面分析相关算法推荐与面向RAG场景的段落拆解方法详述
2. 大模型企业落地与应用-RAG (1.5h)
向量数据库介绍——Faiss、Milvus、Pinecone、Weaviate等
大模型企业落地场景介绍,包括大模型与智能问答系统、大模型与知识库、大模型与知识图谱等问答交互领域的应用与落地。
课程实战:大模型应用搭建——基于RAG的框架搭建(0.5h)
第三天-下午
1. 大模型推理加速与部署(1h)
介绍常用的大模型推理框架与原理,如vLLM、SGLang、FastLLM等
介绍常用大模型整体服务框架,llama.cpp、llama-factory、ollama等
大模型中的量化,如AWQ量化、GPTQ、GGUF等
课程实战:大模型量化实战——面向Qwen系列的大模型量化(0.5h)
2. 大模型应用产品化及交付经验分享(1h)
介绍企业大模型场景化行业应用案例
大模型企业落地场景介绍,包括大模型与智能问答系统、大模型与知识库、大模型与智能编排等场景的应用与落地。
大模型在金融领域的交付案例详述,包括智能问数、智能问答、智能编排等场景中的交付案例
3. 交流与沟通(0.5h)
课后交流

活动详情

提交需求