AI基础术语及其释义
作者:微信文章一、基础概念
人工智能(ArtificialIntelligence,AI)模拟人类智能的科学与技术,使计算机具备学习、推理、感知、决策等能力,应用于图像识别、自然语言处理等领域。
机器学习(MachineLearning,ML)AI的子领域,通过数据自动学习规律并改进性能,无需显式编程,分为监督、无监督、强化学习等类型。
深度学习(DeepLearning)基于多层神经网络的机器学习方法,擅长处理图像、语音等高维数据,核心技术包括卷积神经网络(CNN)、Transformer等。
强化学习(ReinforcementLearning,RL)通过与环境交互获得奖励信号,学习最优策略(如游戏AI、机器人控制)。
自然语言处理(NaturalLanguageProcessing,NLP)
使计算机理解、生成人类语言的技术,涵盖机器翻译、情感分析、问答系统等。
计算机视觉(ComputerVision,CV)让计算机“看懂”图像和视频,用于人脸识别、自动驾驶、医学影像分析等。
认知计算(CognitiveComputing)模拟人类思维过程的系统,结合推理、学习和交互,用于复杂决策支持(如IBMWatson)。
边缘计算(EdgeComputing)在数据源附近处理数据(如摄像头、传感器),降低延迟,支持实时AI应用。
自动化机器学习(AutoML)自动化模型选择、超参数调优等流程,降低AI开发门槛(如GoogleAutoML)。
可解释AI(ExplainableAI,XAI)使模型决策透明化,增强用户信任,适用于医疗诊断、金融风控等高风险场景。
二、算法与模型
监督学习(SupervisedLearning)使用标注数据训练模型(如分类、回归任务),经典算法:线性回归、支持向量机(SVM)。
无监督学习(UnsupervisedLearning)从无标注数据中发现模式(如聚类、降维),典型算法:K均值、主成分分析(PCA)。
集成学习(EnsembleLearning)结合多个模型提升性能(如随机森林、梯度提升树GBDT)。
生成对抗网络(GenerativeAdversarialNetwork,GAN)
生成器与判别器对抗训练,生成逼真数据(图像、文本),用于艺术创作、数据增强。
Transformer架构基于自注意力机制的模型,突破序列处理瓶颈,驱动ChatGPT、BERT等大语言模型。
图神经网络(GraphNeuralNetwork,GNN)处理社交网络、知识图谱等图结构数据,应用于推荐系统、药物发现。
元学习(Meta-Learning)“学会学习”的算法,快速适应新任务(如少样本学习)。
贝叶斯网络(BayesianNetwork)概率图模型,表示变量间依赖关系,用于风险评估、医疗诊断。
联邦学习(FederatedLearning)分布式训练模型,保护数据隐私(如手机用户数据不离开本地)。
神经符号AI(Neuro-SymbolicAI)结合神经网络(感知)与符号推理(逻辑),提升可解释性和推理能力。
三、数据相关
数据标注(DataLabeling)为原始数据添加标签(如图像分类、文本情感标签),是监督学习的基础。
数据增强(DataAugmentation)通过旋转、裁剪、添加噪声等扩充数据集,提升模型泛化能力。
数据湖(DataLake)存储原始数据的仓库(结构化、非结构化),支持灵活分析(如AWSS3)。
数据治理(DataGovernance)确保数据质量、安全与合规性的管理框架(如数据隐私、权限控制)。
特征工程(FeatureEngineering)通过特征提取、转换优化输入数据,直接影响模型性能(如文本向量化)。
数据版本控制(DataVersioning)管理数据集变更历史,确保实验可复现(如DVC工具)。
数据泄露(DataLeakage)测试集信息污染训练集,导致模型过拟合(需严格划分数据集)。
数据偏差(DataBias)数据分布不均衡或包含歧视性信息,导致模型决策不公(需数据清洗)。
四、框架与工具
TensorFlow/PyTorch主流深度学习框架,分别以静态图(TF)和动态图(PyTorch)著称。
HuggingFaceTransformersNLP领域标杆库,提供预训练模型(如GPT、BERT)和便捷API。
Scikit-learn机器学习基础库,涵盖分类、回归、聚类等经典算法。
MLflow管理机器学习生命周期(实验跟踪、模型部署)。
JupyterNotebook/Colab交互式开发环境,支持代码、可视化与文档结合。
Docker/Kubernetes容器化部署工具,实现模型跨平台运行与扩展。
Ray分布式计算框架,支持大规模强化学习与超参数调优。
五、应用场景
推荐系统(RecommendationSystem)基于用户行为数据推荐内容(如Netflix、抖音),常用协同过滤、深度学习。
智能客服(Chatbot)结合NLP与知识图谱,提供7x24小时自动问答服务。
自动驾驶(AutonomousDriving)融合计算机视觉、传感器数据与强化学习,实现车辆自主导航。
AI生成内容(AIGC)生成文本(ChatGPT)、图像(MidJourney)、视频(Sora),革新内容生产。
医疗AI(MedicalAI)辅助疾病诊断(如肺癌CT识别)、药物研发(AlphaFold预测蛋白质结构)。
工业缺陷检测(IndustrialInspection)基于CV的自动化质检,替代人工目检。
六、伦理与法律
算法公平性(AlgorithmicFairness)确保模型不因性别、种族等因素歧视用户(需偏差检测与修正)。
AI透明度(AITransparency)用户有权了解决策逻辑(如欧盟《AI法案》要求高风险系统可解释)。
数据隐私(DataPrivacy)遵守GDPR等法规,最小化数据收集,匿名化处理敏感信息。
AI责任归属(AIAccountability)明确AI错误导致损失时的责任方(开发者、用户或系统本身)。
AI伦理准则(AIEthicsGuidelines)如阿西洛马23原则,强调AI应服务于人类福祉、避免伤害。
七、前沿技术
大语言模型(LargeLanguageModel,LLM)如GPT-4、Claude,通过海量文本训练实现通用对话与推理。
多模态学习(MultimodalLearning)融合文本、图像、语音等多源数据,提升场景理解(如GPT-4V)。
具身智能(EmbodiedAI)赋予AI物理身体(如机器人),通过与环境交互学习技能。
AI芯片(AIAccelerators)专为AI计算设计的硬件(如NVIDIAH100、TPU),提升算力效率。
AIforScienceAI驱动科学发现(如DeepMind预测天气、核聚变控制)。
八、补充说明
AI产品经理核心关注点:技术可行性、用户体验、数据合规性、商业价值闭环。
AI交互设计原则:透明性(告知用户AI参与)、可控性(允许用户修正结果)、容错性(优雅处理AI错误)。
页:
[1]