从0到1学习AI开发:涵盖RAG,embedding,rerank等技术,助力行业落地

从0到1学习AI开发:涵盖RAG,embedding,rerank等技术,助力行业落地

从0到1学习AI开发:涵盖RAG,embedding,rerank等技术,助力行业落地-1

课程内容:

资料

企业RAG技术实战.pdf

ai认知课.pdf

embedding技术.pdf

rerank技术.pdf

llama-factory微调.pdf

13_第五课:模块化RAG(一)顺序模式,条件模式,分支模式.mp4

11_第三课:高级RAG(一)层次索引,句子窗口,子查询,HyDE.mp4

37_第十一课:Langgraph多Agent架构:协作多Age.mp4

8_第五课:模型部署(模型合并导出与量化,本地部署).mp4

29_第三课:Agent平台:国内外主流平台,Coze搭建智能客服.mp4

33_第七课:Agent设计模式(三):Reflexion,LAT.mp4

15_第七课:Embedding原理:word2vec、CBOW.mp4

16_第八课:Embedding模型训练:llamaindex微调.mp4

21_第十三课:相似性搜索算法:k-means,肘部法则.mp4

1_第一课:人工智能介绍:迭代路径,大模型进化树,技术分类.mp4

35_第九课:Langchain项目原理与实战.mp4

5_第二课:微调数据集准备(SFT继续预训练,偏好优化).mp4

17_第九课:Embedding模型评估:MRR评测,MTEB评测.mp4

23_第十五课:向量数据库选型:专用向量数据库,传统数据库支持向量.mp4

10_第二课:NaiveRAG与langchain实践.mp4

39_第十三课:AutoGen项目原理与实战(二):代码执行,工具.mp4

12_第四课:高级RAG(二)提示词压缩,融合,llamainde.mp4

30_第四课:Agent工具使用与functioncall:MR.mp4

9_第一课:RAG技术原理与RAGFlow项目实操.mp4

27_第一课:Agent原理简介:planning、memory、.mp4

22_第十四课:近似邻近算法与过滤向量:PQ量化,HNSW,LSH.mp4

24_第十六课:向量数据库代码示例:chroma与qdrant代码.mp4

20_第十二课:向量数据库简介与相似性测量:欧式距离,余弦相似度.mp4

28_第二课:提示词工程:软提示词,fewshot,COT TOT.mp4

34_第八课:Agent框架:SingleAgent,Multi.mp4

25_第十七课:RAG评估:评估指标,RAGAs,TruLens.mp4

6_第三课:微调过程lora微调与Qlora微调.mp4

7_第四课:模型评估(批量推理与自动评估benchmark).mp4

31_第五课:Agent设计模式(一):Fewshot,ReAct.mp4

40_第十四课:CrewAI项目原理与实战:Crew Task A.mp4

14_第六课:模块化RAG(二)迭代,递归检索,FLARE,Toc.mp4

19_第十一课:Rerank模型微调与实践(二)rankGPT.mp4

26_第十八课:RAG行业落地:实践心得,落地经验,业务场景.mp4

38_第十二课:AutoGen项目原理与实战(一):AutoGen.mp4

18_第十课:Rerank技术原理与实践(一)交叉编码与双编码.mp4

2_第二课:柏拉图表征假说与scalinglaw:KM缩放定律.mp4

4_第一课:大模型微调llama-factory环境准备.mp4

32_第六课:Agent设计模式(二):REWOO,LLMComp.mp4

3_第三课:AI开发环境(python、conda、vscode.mp4

36_第十课:Langgraph项目原理与实战.mp4

人工智能开发实战路线图

那些想真正搞懂AI落地的家伙们得从基础开始啃起,大模型进化树和柏拉图假说这种理论玩意儿其实比想象中重要得多,毕竟没理论支撑的实践就像蒙眼开车;环境配置这块儿很多人栽跟头,Python和Conda的环境冲突能把人逼疯,VSCode插件装不对连调试都成问题。

RAG技术深度拆解

检索增强生成这套东西现在火得发烫,企业级应用里NaiveRAG根本不够看,得玩转层次索引和子查询这些高阶操作;模块化设计里头分支模式特别适合金融风控场景,递归检索配合FLARE框架处理长文档简直绝配,评估环节用RAGAs指标才靠谱,光看召回率会被业务方骂死。

Embedding实战黑科技

词向量这块CBOW模型老掉牙了但还得学明白,微调embedding时loss曲线震荡太剧烈就得调整学习率;相似度计算用余弦还是欧氏距离得看数据分布,HNSW索引的速度提升明显不过内存占用吓人,chroma数据库的批量插入操作有坑要避开。

向量数据库的选型陷阱

专用向量库查询快可是贵得要命,传统数据库扩展向量功能又怕扛不住高并发,生产环境里混合架构可能是更聪明的选择。

Agent系统搭建秘籍

多智能体协作现在是大趋势,Langgraph的并行处理机制能榨干GPU性能;Coze平台做客服机器人省事但定制化弱,REWOO模式处理复杂任务链时要注意状态同步问题,反射式设计让Agent具备纠错能力这个很关键。

工具调用那些糟心事

Function calling的响应延迟超过3秒用户体验直接崩盘,MRKL框架要配合异步IO优化才行。

模型微调魔鬼细节

LoRA微调比全参数训练省显存这事儿大家都知道,但QLoRA的4-bit量化在边缘设备部署才是真本事;偏好数据集清洗不干净会导致奖励模型崩溃,benchmark跑分时候注意温度系数设定别掉进局部最优。

工业落地生死线

医疗行业的RAG应用必须过HIPAA认证,检索时差超过800毫秒医生就直接关页面了;制造业知识库构建要处理非结构化图纸,传统OCR加上embedding混合检索才能搞定,业务场景适配度不够的技术方案都是耍流氓。

分享到 :
相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注