【课程背景】
大模型(Large Language Models, LLMs)现已成为AI领域的一个热点。这些模型以其庞大的参数规模、强大的语言理解和生成能力,以及在多种任务中展现出的高级认知能力,正在改变我们与技术的交互方式。大模型正在以其独特的方式提供各类帮助和改进。但这些模型的成功应用都依赖于强大的数据基座构建,以及对算力、算法和数据的协同优化。
本课程将从AI大模型的整体结构体系拆开来分享AI大模型的特点、技术原理,进而提出对数据、算力的要求,以及目前在通讯行业的应用。
【课程收获】
1. 了解AI大模型的特点、技术原理及要求
2. 理解智算计算和算力网络
3. 了解AI大模型在特定行业的一些应用
【课程时长】1天(6h)
【课程对象】三级经理
【课程大纲】
Part1:AI大模型通识
1 AI大模型是什么?
1.1 什么是模型,AI与模型之间什么关系?
1.2 AI发展史
1.3 机器学习的主要学习范式:监督、无监督、强化、深度学习
1.4 具体的模型架构:CNN、RNN、GAN
2 AI大模型要回答什么问题?
2.1 大模型又是什么?
2.2 大模型常见的学习范式
2.3 大模型常用的模型架构
2.4 大模型的学习算法:梯度下降、优化技巧、并行与分布式训练
2.5 大模型区别于传统AI的独特能力
3 方法论:AI大模型是如何实现目标的?
3.1 大模型形成的工作流
3.2 模型构建:架构选择、参数配置、初始化策略、正则化、优化器选择
3.3 数据训练:数据预训练、批处理、梯度下降、学习率调度、训练监控
3.4 模型评估:评估指标、交叉验证、测试集、误差分析
3.5 模型部署:模型导出、服务化、硬件优化、负载均衡
3.6 模型维护:模型监控、数据更新、模型在训练、版本控制
3.7 模型应用:用户接口、场景适配、反馈循环、伦理与合规
Part2:面向AI大模型的智算与相关技术
1. AI大模型对算力的要求
1.1 智算的出现
1.2 AI大模型对智算的算力要求
1.3 全球智算格局解析
2. AI大模型下,如何破解算力问题
2.1 高端智算芯片的持续性开发投入和升级
2.1.1 高性能AI芯片
2.1.2 专用智能芯片开发
2.2 并行计算技术
2.2.1 模型并行
2.2.2 数据并行
2.2.3 分布式并行计算
2.3 软件平台优化
2.4 架构优化
2.4.1 知识蒸馏
2.4.2 其他模型架构
2.5 算力网络建设
2.5.1算力网络的出现
2.5.2 云网协同
2.5.3 云网融合
2.5.4 算力感知、算力路由和算力交易
2.6 开源与闭源模型结合:大模型+小模型
2.7 通信量优化技术
Part3:AI大模型的行业应用
1. 自然语言处理和意图识别
【案例】华为发布的通信行业首个大模型提供了基于角色的Copilots和基于场景的Agents两类应用能力,帮助运营商提升员工赋能和用户满意度
2. 网络智能化调度:实时分析用户数据和网络负载,预测网络需求,预测频段和流量管理
3. 网络维护:提高电信网络的智能规建、运维和管控能力
【案例】中兴通讯推出了新一代智算中心基础设施产品和AI加速芯片,以支持大模型训练和推理,提升企业效率并降低大模型推理成本
4. 客户服务:在客服领域中显著提升用户体验。
【案例】ChatGPT等生成式AI技术被广泛应用于会话系统中,能够理解人类意图并生成相应的回答或解决方案
5. 运维效率:AI大模型为5G乃至6G通信网络的生产力跃升提供了重要支撑。
【案例】华为发布的无线智能体结合了通信大模型、无线数字孪生系统和智能算力,旨在重塑运维流程、网络体验和业务发展模
6. AI与通信融合及在无线通信系统中的应用
6.1AI大模型在卫星通讯领域展现出巨大潜力
6.2无线智能体构建
6.3 运维流程重塑与业务模式创新
【综合案例】中兴通讯AI解决方案